JP3927067B2 - Conversation control system, conversation control device, conversation control method, program, and recording medium recording program - Google Patents

Conversation control system, conversation control device, conversation control method, program, and recording medium recording program Download PDF

Info

Publication number
JP3927067B2
JP3927067B2 JP2002126732A JP2002126732A JP3927067B2 JP 3927067 B2 JP3927067 B2 JP 3927067B2 JP 2002126732 A JP2002126732 A JP 2002126732A JP 2002126732 A JP2002126732 A JP 2002126732A JP 3927067 B2 JP3927067 B2 JP 3927067B2
Authority
JP
Japan
Prior art keywords
morpheme
information
morpheme information
discourse
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002126732A
Other languages
Japanese (ja)
Other versions
JP2003316781A (en
Inventor
声揚 黄
裕 勝倉
濤 呉
東 李
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PtoPA Inc
Original Assignee
PtoPA Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PtoPA Inc filed Critical PtoPA Inc
Priority to JP2002126732A priority Critical patent/JP3927067B2/en
Priority to PCT/JP2003/004563 priority patent/WO2003085550A1/en
Priority to US10/511,236 priority patent/US8126713B2/en
Priority to EP03745994A priority patent/EP1494129A4/en
Priority to CN03808195.4A priority patent/CN100583086C/en
Priority to AU2003236049A priority patent/AU2003236049B2/en
Publication of JP2003316781A publication Critical patent/JP2003316781A/en
Application granted granted Critical
Publication of JP3927067B2 publication Critical patent/JP3927067B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、利用者からの入力情報に基づいて、入力情報に適した回答を出力する会話制御システム、会話制御装置、会話制御方法、プログラム及びプログラムを記録した記録媒体に関する。
【0002】
【従来の技術】
従来からの会話制御システムにおいては、利用者からの入力情報に基づいて、その入力情報に対応する予め格納された回答内容を出力するので、利用者は、会話制御システムから回答される回答内容により、擬似的に他の利用者と話しているような感覚を味わうことができた。
【0003】
【発明が解決しようとする課題】
しかしながら、上記会話制御システムでは、利用者からの入力情報と、予め格納してある利用者の入力情報(フレーズ)群とを照合し、そのフレーズ群の中から入力情報と一致するフレーズを検索し、検索したフレーズに対応付けられている回答内容を出力するものであることから、上記入力情報と少しでも近似するフレーズを数多く格納しなければ、入力情報により適した回答内容を出力することができなかった。
【0004】
一方、会話制御システムを構築する開発者が、入力情報と少しでも近似する膨大なフレーズと、その膨大なフレーズに対応付けられた回答内容とを予め会話制御システムに格納すれば、上記会話制御システムは、予め格納してある膨大なフレーズ群の中から、入力情報と一致するフレーズを検索し、検索したフレーズに対応付けられている回答内容を出力することができるので、入力情報により適した回答内容を出力することができる。
【0005】
ところが、会話制御システムを構築する開発者は、入力情報と一致するフレーズを会話制御システムで検索させるためには、利用者から入力されるであろう膨大なフレーズ群(無限大に近いフレーズ群)を予め会話制御システムに格納しなければならないこととなり、入力情報により適した回答内容を出力させる会話制御システムを構築することは困難であった。
【0006】
そこで、本願は以上の点に鑑みてなされたものであり、利用者の入力情報を構成する各形態素を特定し、特定した各形態素から把握される意味内容を解析して、解析した意味内容に関連付けられている予め作成された回答内容を出力することで、利用者の入力情報に対応する最適な回答内容を出力し、更に予め格納する各回答内容を少なくしても適切な回答内容を出力することのできる会話制御システム、会話制御装置、会話制御方法、プログラム及びプログラムを記録した記録媒体を提供することを課題とする。
【0007】
【課題を解決するための手段】
本願に係る発明は、上記課題を解決すべくなされたものであり、利用者から入力された入力情報に基づいて、該入力情報に適した回答を取得する際に、利用者から入力された入力情報に基づいて入力情報を示す文字列を特定し、特定された文字列に基づいて、文字列の最小単位を構成する各形態素を第一形態素情報として抽出し、利用者からの入力情報に対して定型的な内容を回答するための定型内容を予め複数記憶し、抽出された第一形態素情報と各定型内容とを照合し、各定型内容の中から、第一形態素情報を含む定型内容を取得することを特徴とするものである。
【0008】
このような本願に係る発明によれば、会話制御装置が、利用者から入力された入力情報を構成する第一形態素情報と予め記憶された各定型内容とを照合し、各定型内容の中から、第一形態素情報を含む定型内容を検索することができるので、会話制御装置は、例えば第一形態素情報が定型内容を示す”こんにちは”である場合には、この定型内容を同一の定型内容”こんにちは”を回答することができる。
【0009】
また、会話制御装置は、利用者の入力情報が定型内容である場合には、その定型内容を回答することができるので、利用者は、最初に、会話制御装置との間で意思の疎通をしているような感覚を味わうことができる。
【0010】
本願に係る発明は、利用者から入力されるであろう入力情報又は利用者への回答内容に関連性のある範囲を構成する形態素を示す談話範囲には、一つの文字、複数の文字列又はこれらの組み合わせからなる形態素を示す第二形態素情報が複数関連付けられ、各第二形態素情報には、利用者への回答内容がそれぞれに関連付けてられており、前記談話範囲を複数記憶し、抽出された第一形態素情報と各談話範囲とを照合し、各談話範囲の中から、第一形態素情報を含む談話範囲を検索し、検索された談話範囲に関連付けられている各第二形態素情報と、抽出された第一形態素情報とを照合し、各第二形態素情報の中から、第一形態素情報を含む第二形態素情報を検索し、検索された第二形態素情報に基づいて、第二形態素情報に関連付けられた回答内容を取得することを特徴とするものである。
【0011】
このような本願に係る発明によれば、会話制御装置は、第一形態素情報と近似する第二形態素情報を検索するには、”談話範囲”に属する各第二形態素情報と第一形態素情報とを照合(ピンポイントで検索することが可能)すればよく、”全て”の第二形態素情報と第一形態素情報とを照合する必要がないので、第一形態素情報と近似している第二形態素情報を検索するまでの時間を短縮することができる。
【0012】
この結果、会話制御装置は、第一形態素情報と近似している第二形態素情報を短時間で検索することができるので、検索された第二形態素情報に基づいて第二形態素情報に関連付けられている回答文を短時間で取得することができ、利用者からの入力情報に対して迅速に回答することができる。
【0013】
また、会話制御装置が、各第二形態素情報の中から、第一形態素情報を構成する形態素(利用者の入力情報を構成する要素)を含む第二形態素情報を検索し、検索した第二形態素情報に基づいて、第二形態素情報に関連付けられた回答内容を取得することができるので、会話制御装置は、利用者の入力情報を構成する各形態素に基づいて、各形態素により構築される意味空間(主体、対象等)を考慮し、かかる意味空間に基づいて予め作成された回答内容を取得することができることとなり、単に入力情報の全体をキーワードとして、そのキーワードに関連付けられた回答内容を取得するよりも、より入力情報に適した回答内容を取得することができる。
【0014】
更に、会話制御装置は、第一形態素情報を含む第二形態素情報を検索するので、利用者の入力情報と完全に一致する第二形態素情報を検索する必要がなく、会話制御装置を開発する開発者は、利用者から入力されるであろう入力情報に対応する膨大な回答内容を予め記憶する必要がなくなり、記憶部の容量を低減させることができる。
【0015】
本願に係る発明は、談話範囲には第二形態素情報が複数関連付けられ、各第二形態素情報には回答内容が複数関連付けられ、各回答内容には各回答内容の種類を示す回答種類がそれぞれに対応付けられており、文字認識手段で特定された文字列に基づいて、入力情報の種類を示す入力種類を特定し、検索された第二形態素情報に基づいて、特定された入力種類と第二形態素情報に関連付けられた各回答種類とを照合し、各回答種類の中から、入力種類と一致する回答種類を検索し、検索された回答種類に基づいて、回答種類に対応付けられた回答内容を取得することを特徴とするものである。尚、入力種類又は回答種類は、肯定、否定又は反発などの種類からなることが望ましい。
【0016】
このような本願に係る発明によれば、会話制御装置が、”談話範囲”に属する各第二形態素情報に関連付けられた回答種類(陳述、肯定、場所、反発など)の中から、利用者の入力種類と一致する回答種類を検索し、検索した回答種類に基づいて、回答種類に対応付けられた回答内容を取得することができるので、会話制御装置は、利用者の会話内容を構成する入力種類、例えば、利用者が単に意見を述べたもの、利用者が抱く感想からなるもの、利用者が場所的な要素を述べたものなどに基づいて、複数の回答内容の中から入力種類にマッチした回答内容を取得することができることとなり、該当する利用者に対してより最適な回答をすることができる。
【0017】
また、会話制御装置は、検索した”談話範囲”にのみ属する各第二形態素情報に関連付けられた回答種類の中から、利用者の入力種類と一致する回答種類を検索(ピンポイント検索)するだけでよいので、”全て”の第二形態素情報に関連付けられた回答種類と利用者の入力種類とを逐一検索する必要がなくなり、利用者の入力種類に対応する最適な回答内容を短時間で取得することができる。
【0018】
本願に係る発明は、抽出された第一形態素情報と各第二形態素情報とを照合し、各第二形態素情報毎に、第二形態素情報に対して第一形態素情報が占める割合を計算し、各第二形態素情報毎に計算された各割合の大きさに応じて、各第二形態素情報の中から、一の第二形態素情報を選択し、選択された第二形態素情報に基づいて、第二形態素情報に関連付けられた回答内容を取得することを特徴とするものである。
【0019】
このような本願に係る発明によれば、会話制御装置が、各第二形態素情報毎に、第二形態素情報に対して該第一形態素情報が占める割合を計算し、各第二形態素情報毎に計算された各割合の大きさに応じて、各第二形態素情報の中から、一の第二形態素情報を選択することができるので、会話制御装置は、例えば、第一形態素情報(利用者の入力情報を構成する要素)が第二形態素情報に占める割合の大きい第二形態素情報を、複数ある第二形態素情報群の中から取得することができれば、第一形態素情報から構成される意味空間を踏襲した第二形態素情報をより的確に取得することができ、結果的に、その第二形態素情報に基づいて利用者の入力情報に対して最適な回答をすることができる。
【0020】
また、会話制御装置は、検索した”談話範囲”にのみ属する各第二形態素情報毎に、第二形態素情報に対して該第一形態素情報が占める割合を計算するので、全ての第二形態素情報に対して第一形態素情報が占める割合を計算する必要がなくなり、第一形態素情報から構成される意味空間を踏襲した第二形態素情報をより短時間で取得することができ、結果的に、取得した第二形態素情報に基づいて利用者からの入力情報に対して最適な回答内容を迅速に出力することができる。
【0021】
本願に係る発明は、複数の形態素の集合からなる集合群の全体を示す要素情報を、該集合群に関連付けて予め複数記憶し、文字列から抽出された形態素と各集合群とを照合し、各集合群の中から形態素を含む集合群を選択し、選択した該集合群に関連付けられた要素情報を第一形態素情報として抽出することを特徴とするものである。
【0022】
このような本願に係る発明によれば、会話制御装置が、文字列から抽出した形態素と各集合群とを照合し、各集合群の中から形態素を含む一の集合群を選択し、選択した集合群に関連付けられた要素情報を第一形態素情報として抽出することができるので、第一形態素情報が例えば”プレゼント”である場合には、”プレゼント”は、例えばプレゼント、贈り物、御中元、お祝いなどからなる集合群に含まれるので、会話制御装置は、その集合群に関連付けられている代表要素、例えば”贈答”を第一形態素情報として抽出することができる。
【0023】
これにより、会話制御装置を開発する開発者は、第一形態素情報から把握される意味空間に対応した第二形態素情報及び第二形態素情報に関連する回答内容を、類似する第一形態素情報毎に逐一作成する必要がなくなり、結果的に、記憶部に格納させるデータ量を低減させることができる。
【0024】
本願に係る発明は、第二形態素情報を構成する各形態素が、主格からなる主体格、目的格からなる対象格などの属性毎に分類されて予め記憶され、抽出された第一形態素情報の各形態素を主体格、対象格などの各属性に分類し、分類された各属性に属する第一形態素情報の各形態素と、予め記憶された各属性に属する各第二形態素情報の各形態素とを各属性毎に照合し、”談話範囲”に属する各第二形態素情報の中から、少なくとも一の属性に第一形態素情報の形態素を含む第二形態素情報を検索することを特徴とするものである。
【0025】
このような本願に係る発明によれば、会話制御装置が、分類された各属性(主体格、対象格など)に属する第一形態素情報の各形態素と、予め記憶された各属性に属する各第二形態素情報の各形態素とを各属性毎に照合し、各第二形態素情報の中から、少なくとも一の属性に第一形態素情報の各形態素を含む第二形態素情報を検索することができるので、会話制御装置は、通常の語順とは異なるものから構成される入力情報、例えば”人が犬を噛む”である場合には、主体格の形態素が”人”、対象格の形態素が”犬”であることから、その各「格」に属する形態素と一致する第二形態素情報を検索することができ、その第二形態素情報に関連付けられている回答内容{”本当に?”又は”意味がよくわかんないよ”など}を取得することができる。
【0026】
即ち、会話制御装置は、識別が困難な入力情報、例えば”人が犬を噛む”と”犬が人を噛む”とを識別することができるので、その識別した入力情報により適した回答、前者については例えば”本当に?”、後者については例えば”大丈夫?”をすることができる。
【0027】
また、会話制御装置は、”談話範囲”に属する各第二形態素情報の中から、少なくとも一の属性に第一形態素情報の形態素を含む第二形態素情報を検索すればよいので、全ての第二形態素情報の中から、一の第二形態素情報を取得する必要がなくなり、第一形態素情報から構成される意味空間を踏襲した第二形態素情報をより短時間で取得することができ、結果的に、取得した第二形態素情報に基づいて利用者からの入力情報に対して最適な回答内容を迅速に出力することができる。
【0028】
更に、本願に係る発明は、第一形態素情報が、主格からなる主体格、目的格からなる対象格などの属性毎に対応付けられた各形態素からなり、抽出された第一形態素情報に基づいて、第一形態素情報を構成する各属性の中から、形態素を含まない属性を検索し、検索された属性に基づいて、その属性に、検索された談話範囲を構成する形態素を付加し、検索された談話範囲に関連付けられている各第二形態素情報と、形態素が付加された前記第一形態素情報とを照合し、各第二形態素情報の中から、第一形態素情報を含む第二形態素情報を検索することを特徴とするものである。
【0029】
このように本願に係る発明によれば、会話制御装置は、利用者の入力情報を構成する第一形態素情報が省略文であり、日本語として明解でない場合であっても、第一形態素情報がある談話範囲に属している場合には、その談話範囲を第一形態素情報に付加し、省略文からなる第一形態素情報を補完することができる。
【0030】
このため、会話制御装置は、第一形態素情報を構成する入力情報が省略文であっても、第一形態素情報を構成する入力情報が適正な日本語となるように、第一形態素情報に特定の形態素を補完することができるので、補完後の第一形態素情報に基づいて、各第二形態素情報の中から、第一形態素情報に関連する最適な第二形態素情報を取得することができ、取得した第二形態素情報に基づいて利用者の入力情報により適した回答内容を出力することができる。
【0031】
この結果、会話制御装置は、利用者からの入力情報が省略文であったとしても、ニューロネットワーク、人工知能などの機能を用いることなく、過去の検索結果を通じて、その省略文が何を意味するのかを推論することができ、会話制御装置の開発者は、ニューロネットワーク、人工知能を搭載する必要がないので、会話制御装置のシステムをより簡便に構築することができる。
【0032】
また、本願に係る発明は、検索された第二形態素情報に基づいて、第二形態素情報と検索された談話範囲とを照合し、第二形態素情報を構成する各形態素の中から、該談話範囲と一致する前記形態素を削除し、形態素が削除された第二形態素情報に基づいて、検索された談話範囲に関連付けられた他の談話範囲を取得し、取得した他の談話範囲を構成する形態素を、第二形態素情報に付加し、形態素が付加された第二形態素情報に基づいて、第二形態素情報に関連付けられた回答内容を取得することを特徴とするものである。
【0033】
このような本願に係る発明によれば、会話制御装置は、検索された第二形態素情報に基づいて、第二形態素情報と検索された談話範囲とを照合し、第二形態素情報を構成する各形態素の中から、該談話範囲と一致する形態素を削除し、形態素が削除された第二形態素情報に基づいて、他の談話範囲を構成する形態素を、該第二形態素情報に付加することができるので、その形態素が付加された第二形態素情報に基づいて、第二形態素情報に関連付けられた回答文を取得することができる。
【0034】
この結果、会話制御装置は、利用者の入力情報に対する回答文を直接的に出力するわけではないが、新たに付加された形態素を含む第二形態素情報に基づいて、入力情報に関連する回答文を出力することができるので、利用者の入力情報に対する回答内容が予め記憶されていない場合であっても、利用者の入力情報に関連する回答内容を取得することができる。
【0035】
更に、本願に係る発明は、各第二形態素情報の中から、第一形態素情報を含む第二形態素情報を検索することができない場合に、第一形態素情報と各回答内容とを照合し、各回答内容の中から、第一形態素情報を含む回答内容を検索することができたときは、検索した回答内容に関連付けられている第二形態素情報を取得することを特徴とするものである。
【0036】
このような本願に係る発明によれば、会話制御装置は、各第二形態素情報の中から、第一形態素情報と一致する第二形態素情報を検索することができなくても、各回答文の中から、第一形態素情報を構成する形態素(アクション又はアクションに対応付けられた形態素)を含む回答文を特定し、この特定した回答文に関連付けられている第二形態素情報を検索することができるので、利用者の入力情報を構成する第一形態素情報に対応する第二形態素情報を適切に検索することができる。
【0037】
この結果、会話制御装置が第一形態素情報に対応する最適な第二形態素情報を検索することができるので、会話制御装置は、検索した最適な第二形態素情報に基づいて、利用者の入力情報に対する適切な回答内容を取得することができる。
【0038】
本願に係る発明は、記憶される定型内容が、利用者が求める話題、ある事柄に対する利用者の感情度、又は陳述文、肯定文、疑問文、反発文などの種類をその意味内容に応じて形態素と関連付けて階層的にデータベースに蓄積するための言語で記述されることを特徴とするものである。
【0039】
これにより、会話制御装置を開発する開発者は、利用者の入力情報に対する回答内容を検索するための第二形態素情報等を、データベースにおいて前記言語を用いて階層的に構築することができるので、会話制御装置は、利用者の入力情報に基づいて入力情報に対する回答内容を、階層的な手順を経てデータベースから取得することができる。
【0040】
即ち、会話制御装置は、利用者の入力情報の階層(例えば、データベースに蓄積されている第二形態素情報に対して上位概念にあるのか、又は下位概念にあるのか)を見極めて、見極めた階層に基づいて予め蓄積された各回答内容の中から、適切な回答内容を取得することができる。
【0041】
このため、会話制御装置は、利用者の入力情報からなる第一形態素情報と、予め記憶されている全ての第二形態素情報とを逐一照合することなく、ある特定の階層に属する各第二形態素情報と第一形態素情報とを照合すればよいので、第一形態素情報と近似する第二形態素情報を短時間で取得することができる。
【0042】
尚、記憶される定型内容、談話範囲、第二形態素情報、回答内容、回答種類又は集合群が、前記言語で記述されることを特徴とするものであってもよい。この言語は、DKML(Discourse Knowledge Markup Language)からなることが望ましい。
【0043】
本願に係る発明は、各会話制御装置が通信ネットワークに接続され、一の会話制御装置が他の会話制御装置に対して前記通信ネットワークを介して前記言語で記述された定型内容、談話範囲、第二形態素情報、回答内容、回答種類又は集合群を取得することを特徴とするものである。
【0044】
尚、前記言語で記述された定型内容、談話範囲、第二形態素情報、回答内容、回答種類又は集合群等を記憶するサーバが通信ネットワーク上に配置され、会話制御装置が、通信ネットワークを介して、サーバから前記言語で記述された定型内容、談話範囲、第二形態素情報、回答内容、回答種類又は集合群を取得してもよい。
【0045】
これにより、会話制御装置は、例えば、会話制御装置に利用者の入力情報に適した回答内容がない場合には、通信ネットワークを通じて、他の会話制御装置から利用者の入力情報に適した回答内容(DKMLなどで記述されたもの)等を検索し、検索した回答内容等を取得することができる。
【0046】
本願に係る発明は、取得された過去の回答内容の履歴を記憶し、利用者から入力された入力情報に合意するための合意内容を予め記憶し、取得された現在の第一形態素情報と過去の回答内容とを照合し、現在の第一形態素情報が過去の回答内容に含まれる場合には、合意内容を取得することを特徴とするものである。
【0047】
このような本願に係る発明によれば、会話制御装置が、現在の第一形態素情報と過去の回答内容とを照合し、現在の第一形態素情報が過去の回答内容に含まれている場合には、会話制御装置は、利用者から現在入力された入力情報と過去の回答内容とが一致しているため、利用者が過去の回答内容に対して鸚鵡返し(利用者が回答内容に対して聞き直していること)の入力情報を入力したものと断定することができる。
【0048】
この場合、会話制御装置は、利用者が過去の回答内容に対して鸚鵡返しを行っているので、記憶されている合意内容を取得し、取得した合意内容(例えば、”その通りです”など)を出力することができる。これにより、利用者は、会話制御装置から出力された回答内容の意味が分からなければ、もう一度聞き直して、再度回答内容を聞き直すことができるので、恰も他の利用者と会話しているような感覚を味わうことができる。
【0049】
本願に係る発明は、取得された過去の第一形態素情報を記憶し、利用者に対して反発するための反発内容を予め記憶し、取得された現在の第一形態素情報と過去の第一形態素情報とを照合し、現在の第一形態素情報が過去の第一形態素情報に含まれる場合には、反発内容を取得することを特徴とするものである。
【0050】
このような本願に係る発明によれば、会話制御装置が、現在の第一形態素情報と過去の第一形態素情報とを照合し、現在の第一形態素情報が過去の第一形態素情報に含まれる場合には、反発内容を取得することができるので、会話制御装置は、前回入力された入力情報が今回入力された入力情報に含まれている場合には、利用者が前の入力情報と同一の内容を反復して入力したものと判断することができ、利用者が会話制御装置からの回答内容に対して適切に回答していないものと断定することができる。
【0051】
この場合、会話制御装置は、利用者が会話制御装置からの回答内容に対して適切に回答していないので、利用者に対して反発するため、記憶されている反発内容を取得し、取得した反発内容を出力する。これにより、利用者は、会話制御装置からの回答内容に対して適切な入力情報を入力しなければ、会話制御装置から反発内容が出力されるので、恰も他の利用者と会話しているような感覚を味わうことができる。
【0052】
尚、第一形態素情報を含む第二形態素情報(談話範囲、定型内容又は回答内容等をも含む。以下、「第二形態素情報等」と略す)とは、第二形態素情報等が第一形態素情報をそのまま含む場合のみならず、第二形態素情報等が第一形態素情報を構成する少なくとも一つの形態素を含む場合をも意味するものとする。
【0053】
【発明の実施の形態】
[会話制御システムの基本構成]
本発明に係る会話制御システムについて図面を参照しながら説明する。図1は、本実施形態に係る会話制御装置1を有する会話制御システムの概略構成図である。
【0054】
同図に示すように、会話制御装置1は、入力部100と、音声認識部200と、会話制御部300と、文解析部400と、会話データベース500と、出力部600と、音声認識辞書記憶部700とを備えている。
【0055】
尚、本実施形態では、説明の便宜上、利用者の発話内容(この発話内容は、入力情報の一種)に限定して説明するが、この利用者の発話内容に限定されるものではなく、キーボード等から入力された入力情報であってもよい。従って、以下に示す「発話内容」は、「発話内容」を「入力情報」に置き換えて説明することもできる。
【0056】
同様にして、後述の説明では、説明の便宜上、「発話文のタイプ」(発話種類)に限定して説明するが、この「発話文のタイプ」に限定されるのではなく、キーボードなどから入力された入力情報の種類を示す「入力種類」であってもよい。従って、以下に示す「発話文のタイプ」(発話種類)は、「発話種類」を「入力種類」に置き換えて説明することもできる。
【0057】
入力部100は、利用者からの入力情報を取得する取得手段であり、本実施形態では、マイクロホン、キーボード等が挙げられる。この入力部100は、利用者から入力された入力情報に基づいて、入力情報を示す文字列を特定する文字認識手段でもある。
【0058】
ここで、入力情報とは、キーボード等を通じて入力された文字、記号、音声等を意味するものである。具体的に、入力部100は、利用者の入力情報(音声以外)を取得し、取得した入力情報を会話制御部300に出力する。また、利用者からの発話内容(この発話内容は、音声からなるものであり、入力情報の一種である)をマイクロホンなどで取得した入力部100は、取得した発話内容を構成する音声を音声信号として音声認識部200に出力する。
【0059】
音声認識部200は、入力部100で取得した発話内容に基づいて、発話内容に対応する文字列を特定する文字認識手段である。具体的には、入力部100から音声信号が入力された音声認識部200は、入力された音声信号を解析し、解析した音声信号に対応する文字列を、音声認識辞書記憶部700に格納されている辞書を用いて特定し、特定した文字列を文字列信号として会話制御部300に出力する。音声認識辞書記憶部700は、標準的な音声信号に対応する辞書を格納しているものである。
【0060】
前記文解析部400は、入力部100又は音声認識部200で特定された文字列を解析するものであり、本実施形態では、図2に示すように、形態素抽出部410と、文節解析部420と、文構造解析部430と、発話種類判定部440と、形態素データベース450と、発話種類データベース460とを有している。
【0061】
形態素抽出部410は、入力部100又は音声認識部200で特定された文字列に基づいて、文字列の最小単位を構成する各形態素を第一形態素情報として抽出する形態素抽出手段である。
【0062】
具体的に、管理部310から文字列信号が入力された形態素抽出部410は、入力された文字列信号に対応する文字列の中から各形態素を抽出する。ここで、形態素とは、本実施形態では、文字列に現された語構成の最小単位を意味するものとする。この語構成の最小単位としては、図3に示すように、例えば、名詞、形容詞、動詞などの品詞が挙げられる。各形態素は、本実施形態では、m1、m2、・・・、mlと表現する。
【0063】
即ち、形態素抽出部410は、入力された文字列信号に対応する文字列と、形態素データベース450に予め格納されている名詞、形容詞、動詞などの形態素群とを照合し、文字列の中から形態素群と一致する各形態素(m1、m2、・・・)を抽出し、抽出した各形態素を抽出信号として文節解析部420に出力する。
【0064】
文節解析部420は、形態素抽出部410で抽出された各形態素に基づいて、各形態素を文節形式に変換する変換手段である。具体的に、形態素抽出部410から抽出信号が入力された文節解析部420は、入力された抽出信号に対応する各形態素を用いて文節形式にまとめる。
【0065】
ここで、文節形式とは、本実施形態では、日本語文法において、自立語又は自立語に一つ以上の付属語がついた文、或いは、日本語文法の意味を崩さない程度に文字列をできるだけ細かく区切った一区切りの文を意味する。この文節は、本実施形態では、p1、p2、・・・pkと表現する。
【0066】
即ち、文節解析部420は、図4に示すように、入力された抽出信号に対応する各形態素に基づいて各形態素の係り受け要素(例えば、が(m2)・は(m4)・を(m5)・・)を抽出し、抽出した係り受け要素に基づいて各形態素を各文節にまとめることを行う。同図に示す「t」は、転置を意味する。
【0067】
各形態素を各文節にまとめた文節解析部420は、各形態素をまとめた各文節と、各文節を構成する各形態素とを含む文型情報を文型信号として文構造解析部430及び発話種類判定部440に出力する。
【0068】
文構造解析部430は、文節解析部420で分節された第一形態素情報の各形態素を主体格、対象格などの各属性に分類する分類手段である。具体的に、文節解析部420から文型信号が入力された文構造解析部430は、入力された文型信号に対応する各形態素と各形態素からなる文節とに基づいて、文節に含まれる各形態素の「格構成」を決定する。
【0069】
ここで、「格構成」とは、文節における実質的な概念を示す格(属性)を意味するものであり、本実施形態では、例えば、主語・主格を意味するサブジェクト(主体格)、対象を意味するオブジェクト(対象格)、動作を意味するアクション、時間を意味するタイム(テンス、アスペクト)、場所を意味するロケーション等が挙げられる。本実施形態では、サブジェクト、オブジェクト、アクションの三要素の「格」(格構成)に対応付けられた各形態素を第一形態素情報とする。
【0070】
即ち、文構造解析部430は、図5に示すように、例えば、各形態素の係り受け要素が”が”又は”は”である場合は、その係り受け要素の前にある形態素がサブジェクト(主語又は主格)であると判断する。また、文構造解析部430は、
例えば、各形態素の係り受け要素が”の”又は”を”である場合は、その係り受け要素の前にある形態素がオブジェクト(対象)であると判断する。
【0071】
更に、文構造解析部430は、例えば、各形態素の係り受け要素が”する”である場合は、その係り受け要素の前にある形態素がアクション(述語;この述語は動詞、形容詞などから構成される)であると判断する。
【0072】
各文節を構成する各形態素の「格構成」を決定した文構造解析部430は、決定した「格構成」に対応付けられた第一形態素情報に基づいて、後述する話題(トピック)の範囲を特定させるための話題検索命令信号を反射的判定部320に出力する。
【0073】
発話種類判定部440は、文節解析部420で特定された文節に基づいて、発話内容(入力情報)の種類を示す発話種類(入力種類)を特定する種類特定手段である。具体的に、文節解析部420から入力された文型信号に対応する各形態素と各形態素から構成される文節とに基づいて、「発話文のタイプ」(発話種類)を判定する。
【0074】
ここで、「発話文のタイプ」は、本実施形態では、図6に示すように、陳述文(D;Declaration)、感想文(I;Impression)、条件文(C;Condition)、結果文(E;Effect)、時間文(T;Time)、場所文(L;Location)、反発文(N;Negation)などから構成されるものである。
【0075】
陳述文とは、利用者の意見又は考えなどからなる文を意味するものであり、本実施形態では、図6に示すように、例えば”佐藤が好きだ”などの文が挙げられる。感想文とは、利用者が抱く感想からなる文を意味するものである。場所文とは、場所的な要素からなる文を意味するものである。
【0076】
結果文とは、話題に対して文が結果の要素を含む文から構成されるものを意味する。時間文とは、話題に関わる時間的な要素を含む文から構成されるものを意味する。
【0077】
条件文とは、一つの発話を話題と捉えた場合に、話題の前提、話題が成立している条件や理由などの要素を含む文から構成されるものを意味する。反発文とは、発話相手に対して反発するような要素を含む文から構成されるものを意味する。各「発話文のタイプ」についての例文は、図6に示す通りである。
【0078】
即ち、発話種類判定部440は、入力された文型信号に対応する各文節に基づいて、その各文節と発話種類データベース460に格納されている各辞書とを照合し、各文節の中から、各辞書に関係する文要素を抽出する。各文節の中から各辞書に関係する文要素を抽出した発話種類判定部440は、抽出した文要素に基づいて、「発話文のタイプ」を判定する。文要素とは、文字列の種類を特定するための分の種別を意味し、文要素は、本実施形態では、上記説明した定義句(〜のことだ)などが挙げられる。
【0079】
ここで、上記発話種類データベース460は、図7に示すように、定義句(例えば、〜のことだ)に関係する辞書を備えた定義表現事例辞書、肯定句(例えば、賛成、同感、ピンポーン)に関係する辞書を備えた肯定事例辞書、結果句(例えば、それで、だから)に関係する辞書を備えた結果表現事例辞書、挨拶句(例えば、こんにちは)に関係する辞書を備えた挨拶事例辞書、否定句(例えば、馬鹿言うんじゃないよ、反対)に関係する辞書を備えた否定事例辞書などから構成され、各辞書は、「発話文のタイプ」と関連付けられている。
【0080】
これにより、発話種類判定部440は、文節と発話種類データベース460に格納されている各辞書とを照合し、文節の中から各辞書に関連する文要素を抽出し、抽出した文要素に関連付けられた判定の種類を参照することで、「発話文のタイプ」を判定することができる。
【0081】
この発話種類判定部440は、後述する話題検索部360からの指示に基づいて、該当する利用者に特定の回答文を検索させるための回答検索命令信号を回答文検索部370に出力する。
【0082】
前記会話データベース500は、一つの文字、複数の文字列又はこれらの組み合わせからなる各形態素を示す第二形態素情報と、発話内容に対する利用者への回答内容とを予め相互に関連付けて複数記憶する回答記憶手段(談話記憶手段)である。また、会話データベース500は、複数の回答内容に対応付けられた各回答内容の種類を示す回答種類を、第二形態素情報に関連付けて予め複数記憶する回答記憶手段(談話記憶手段)でもある。
【0083】
更に、会話データベース500は、利用者から入力されるであろう入力内容又は利用者への回答内容に関連性のある範囲を構成する形態素を示す談話範囲(キーワード)を予め複数記憶する談話記憶手段でもある。この談話範囲(キーワード)には、一つの文字、複数の文字列又はこれらの組み合わせからなる形態素を示す第二形態素情報が複数関連付けられ、各第二形態素情報には、利用者への回答内容がそれぞれに関連付けてられている。
【0084】
更にまた、会話データベース500は、第二形態素情報を構成する各要素を、主格からなる主体各、目的格からなる対象格などの属性に分類して記憶する回答記憶手段(談話記憶手段)でもある。
【0085】
この会話データベース500は、図8に示すように、本実施形態では、大きく分けると、利用者から発話されるであろう発話内容又は利用者への回答内容について関連性のある範囲を意味する談話範囲(ディスコース)と、利用者が発話している内容に最も密接な関連性のある範囲を意味する話題(トピック)とから構成されている。同図に示すように、”談話範囲”は、本実施形態では、”話題”の上位概念として位置付けるものとする。
【0086】
各談話範囲は、図9に示すように、階層構造となるように構成することができる。同図に示すように、例えば、ある談話範囲(映画)に対する上位概念の談話範囲(娯楽)は、上の階層構造に位置するようにし、談話範囲(映画)に対する下位概念の談話範囲(映画の属性、上映映画)は、下の階層構造に位置するようにすることができる。即ち、各談話範囲は、本実施形態では、他の談話範囲との間で上位概念、下位概念、同義語、対義語の関係が明確となる階層位置に配置することかできる。
【0087】
上述の如く、談話範囲は、各話題から構成されるものであり、本実施形態では、例えば、談話範囲がA映画名であれば、A映画名に関係する複数の話題を含んでいる。
【0088】
この話題は、一つの文字、複数の文字列又はこれらの組み合わせからなる形態素、即ち、利用者から発話されるであろう発話内容を構成する各形態素を意味するものであり、本実施形態では、サブジェクト(主体格)、オブジェクト(対象格)、アクションの「格」(属性)に対応付けられた各形態素からなるものである。これら三要素に対応付けられた各形態素は、本実施形態では、話題タイトル(この話題タイトルは、”話題”の下位概念に相当するものである)(第二形態素情報)と表現することにする。
【0089】
尚、話題タイトルには、上記三要素に対応付けられた各形態素に限定されるものではなく、他の「格」、即ち、時間を意味するタイム(テンス、アスペクト)、場所を意味するロケーション、条件を意味するコンディション、感想を意味するインプレッション、結果を意味するエフェクトなどに対応付けられた各形態素を有してもよい。
【0090】
この話題タイトル(第二形態素情報)は、本実施形態では、会話データベース500に予め格納されているものであり、上記第一形態素情報(利用者が発話した発話内容から導かれたもの)とは区別されるものである。
【0091】
例えば、話題タイトルは、談話範囲が”A映画名”である場合には、図10に示すように、サブジェクト(A映画名)、オブジェクト(監督)、アクション(素晴らしい){これは、”A映画名の監督は素晴らしい”を意味する}から構成されるものである。
【0092】
話題タイトルのうち、「格構成」(サブジェクト、オブジェクト、アクションなど)に対応付けられた形態素がない場合は、その部分については、本実施形態では、”*”を示すことにする。
【0093】
例えば、{A映画名って?}の文を話題タイトル(サブジェクト;オブジェクト;アクション)に変換すると、{A映画名って?}の文のうち、”A映画名”がサブジェクトとして特定することができるが、その他”オブジェクト””アクション”は文の要素になっていないので、話題タイトルは、”サブジェクト”(A映画名);”オブジェクト”なし(*);”アクション”なし(*)となる(図10参照)。
【0094】
回答文とは、利用者に対して回答する回答文(回答内容)を意味するものであり、本実施形態では、各話題タイトル(第二形態素情報)に関連付けられている(図8参照)。回答文は、本実施形態では、本実施形態では、図11に示すように、利用者から発話された発話文のタイプに対応した回答をするために、陳述文(D;Declaration)、感想文(I;Impression)、条件文(C;Condition)、結果文(E;Effect)、時間文(T;Time)、場所文(L;Location)、否定文(N;Negation)などのタイプ(回答種類)に分類されている。
【0095】
即ち、各回答文は、図12に示すように、例えば、談話範囲(佐藤){下位概念;ホームラン、上位概念;草野球、同義語;パンダ佐藤・佐藤選手・パンダ}及び各話題タイトルと関連付けられている。
【0096】
同図に示すように、例えば、話題タイトル1−1が{(佐藤;*;好きだ):これは、上述の如く(サブジェクト;オブジェクト;アクション)の順番からなるものである。この順番は、以下同様とする}である場合は、その話題タイトル1−1に対応する回答文1−1は、(DA;陳述肯定文”佐藤が好きです”)、(IA;感想肯定文”佐藤がとても好きです”)、(CA;条件肯定文”佐藤のホームランはとても印象的だからです”)、(EA;結果肯定文”いつも佐藤の出る試合をテレビ観戦してしまいます”)、(TA;時間肯定文”実は、甲子園での5打席連続敬遠から好きになっています”)、(LA;場所肯定文”打撃に立ったときの真剣な顔が好きですね”)、(NA;反発肯定文”佐藤を嫌いな人とは話したくないですね、さよなら”)などが挙げられる。
【0097】
前記会話制御部300は、本実施形態では、図2に示すように、管理部310と、反射的判定部320と、鸚鵡返し判定部330と、談話範囲決定部340と、省略文補完部350と、話題検索部360と、回答文検索部370とを有している。
【0098】
前記管理部310は、会話制御部300の全体を制御するものである。具体的に、入力部100又は音声認識部200から文字列が入力された管理部310は、入力された文字列を文字列信号として形態素抽出部410に出力する。また、管理部310は、回答文検索部370で検索された回答文を出力部600に出力する。
【0099】
反射的判定部320は、形態素抽出部410で抽出された第一形態素情報と各定型内容を照合し、各定型内容の中から、第一形態素情報を含む定型内容を検索する定型取得手段である。
【0100】
ここで、定型内容とは、利用者からの発話内容に対して定型的な内容を回答するための反射要素情報を意味し、この反射要素情報は、反射要素データベース801(定型記憶手段)に予め複数記憶されている。反射要素情報としては、本実施形態では、図13に示すように、例えば”おはよう”、”こんにちは”、”こんばんわ”、”やあ”などの「挨拶的要素」、「なるほど」、「本当?」などの「定型的要素」などが挙げられる。
【0101】
具体的に、文構造解析部430から話題検索命令信号が入力された反射的判定部320は、入力された話題検索命令信号に含まれる第一形態素情報と反射要素データベース801に記憶されている各反射要素情報とを照合し、各反射要素情報の中から、第一形態素情報を含む反射要素情報を検索し、検索した反射要素情報を管理部310に出力する。
【0102】
即ち、反射要素情報をD1、第一形態素情報をWとすると、反射的判定部320は、W∩D1≠φ(φ;空集合)の関係が成立していると判断した場合は、上記反射的な回答を行うための処理を行う。
【0103】
例えば、利用者が”おはよう”という発話内容を発した場合には、反射的判定部320は、発話内容”おはよう”と各反射要素情報とを照合し、各反射要素情報の中から、発話内容”おはよう”を含む(と一致する)反射要素情報”おはよう”を検索し、検索した反射要素情報”おはよう”を管理部310に出力する。
【0104】
反射的判定部320は、各反射要素情報の中から、発話内容を含む反射要素情報を検索することができない場合には、文構造解析部430から入力された話題検索命令信号を鸚鵡返し判定部330に出力する。
【0105】
鸚鵡返し判定部330は、形態素抽出部420で抽出された現在の第一形態素情報と、鸚鵡返し要素データベース802に記憶されている過去の回答内容とを照合し、現在の第一形態素情報が過去の回答内容に含まれる場合には、合意内容を取得する定型取得手段である。
【0106】
ここで、鸚鵡返しとは、本実施形態では、利用者の発話内容をそのまま(又はそれに近い内容を)言い返すことを意味する。鸚鵡返し要素は、本実施形態では、直前に会話制御装置1から出力された回答内容を構成する第一形態素情報などからなるのもであり、図14に示すように、例えば、”馬は美しい”(馬;*;美しい)、”佐藤が好きです”(佐藤;*;好きです)などが挙げられる。
【0107】
また、鸚鵡返し要素データベース802は、利用者から入力された入力情報に合意するための合意内容を予め記憶する合意記憶手段でもある。合意内容には、例えば、前回、利用者から入力された入力情報(利用者により前回の入力情報が”A映画名の監督はS氏ですか”である場合には、合意内容としては、”A映画名の監督はS氏です”)、又は ”その通りです”、”本当です”などが挙げられる。
【0108】
具体的に、反射的判定部320から話題検索命令信号が入力された鸚鵡返し判定部330は、各鸚鵡返し要素毎に、入力された話題検索命令信号に含まれる第一形態素情報と鸚鵡返し要素を構成する各形態素とを照合し、鸚鵡返し要素の中に第一形態素情報が含まれているかを判断する(図14参照)。
【0109】
鸚鵡返し判定部330は、各鸚鵡返し要素の中に第一形態素情報が含まれていると判断した場合には、合意内容を取得し、取得した合意内容からなる回答文を管理部310に出力(鸚鵡返し処理)する。即ち、鸚鵡返し要素(前回の回答文など)をS、第一形態素情報をWとすると、鸚鵡返し判定部330は、W⊂S、W≠φの関係が成立している場合には、上記に示す鸚鵡返し処理を行う。
【0110】
例えば、会話制御装置1が回答文として”A映画名の監督はS氏です”(A映画名の監督;S氏;*)(この順番は、サブジェクト;オブジェクト;アクションの順番、以下同様とする)を出力し、その後、利用者が出力された回答内容に対して”A映画名の監督はS氏ですか”(A映画名の監督;S氏;*)と発話した場合には、鸚鵡返し判定部330は、利用者の第一形態素情報(A映画名の監督;S氏;*)と回答文の各形態素(A映画名の監督;S氏;*)とが一致しているので、利用者は回答内容に対して鸚鵡返しを行っていると断定し、記憶されている合意内容”その通りです”などを取得し、取得した合意内容を出力する。
【0111】
また、鸚鵡返し判定部330は、形態素抽出部410で抽出された現在の第一形態素情報と、鸚鵡返し要素データベース802に記憶されている過去の第一形態素情報とを照合し、現在の第一形態素情報が過去の第一形態素情報に含まれる場合には、反発内容を取得する定型取得手段でもある。
【0112】
具体的には、利用者が”馬は美しい”という発話内容を発話し、会話制御装置1が回答内容として”馬は躍動感があって良いですね”の内容を出力した場合に、後に利用者が”馬は美しい”という発話内容を繰り返したときは、鸚鵡返し判定部330は、現在の発話内容”馬は美しい”を構成する各形態素(第一形態素情報){馬;*;美しい}と前の発話内容”馬は美しい”を構成する各形態素(第一形態素情報){馬;*;美しい}とが一致しているので、利用者は会話制御装置1からの回答内容”馬は躍動感があって良いですね”については全く聞いていないものと断定することができる。
【0113】
この場合、鸚鵡返し判定部330は、利用者が会話制御装置1からの回答内容を聞いていないので、記憶された反発内容(例えば、同じ内容を繰り返さないでよ”など)取得し、取得した反発内容を出力することができる。
【0114】
一方、鸚鵡返し判定部330は、第一形態素情報が前回の回答文の内容と同一、又は第一形態素情報が前回の第一形態素情報と同一でないと判断した場合には、反射的判定部320から入力された話題検索命令信号を談話範囲決定部340に出力する。
【0115】
尚、上記の鸚鵡返し判定部330は、「会話制御装置1の回答内容」に対して利用者が鸚鵡返しを行った場合の処理を示してきたが、更に以下の処理も行うことができる。例えば、出力部600が”馬は美しい”という回答文を出力した場合、この回答文に対して利用者が”どうして馬は美しいの?”、”どうして美しいの?”、又は”どうして?”と発話した場合に対して行う鸚鵡返し判定部330の処理である。
【0116】
この場合、鸚鵡返し判定部330は、出力した回答文S”馬は美しい”と利用者からの発話内容W(”どうして馬は美しいの?(疑問文)”又は”どうして美しいの?(疑問文)”)とを照合すると、(W−c)⊂S、S≠φ、c≠φ(このcは、Wの発話種類を意味し、この発話種類は、後述する発話種類判定部440で判定されるものである。発話種類には、後述するように、例えば、疑問文などが挙げられる。)の関係が成立するので、”条件付”の鸚鵡返し処理(回答内容に対して利用者が疑問文付きの鸚鵡返しを行った場合の処理)を行う。
【0117】
”条件付”の鸚鵡返し処理としては、例えば、会話制御装置1が”馬は美しいね”の回答文を出力した場合に、上記利用者が”どうして馬は美しいの?”の発話内容を発したときは、利用者の疑問等を解消するため、鸚鵡返し判定部330が”だって馬は美しいじゃない”などの回答文を鸚鵡返し要素データベース802の中から取得し、取得した回答文を管理部310に出力する処理を行う。
【0118】
談話範囲決定部340は、文節解析部420で抽出された第一形態素と各談話範囲とを照合し、各談話範囲の中から、第一形態素情報を含む談話範囲を検索する談話検索手段である。
【0119】
具体的に、鸚鵡返し判定部330から話題検索命令信号が入力された談話範囲決定部340は、入力された談話検索命令信号に基づいて、利用者の談話範囲を決定する。即ち、談話範囲決定部340は、入力された検索命令信号に基づいて、会話データベース500の中から、利用者が発話している内容について関連性のある範囲(談話範囲)を検索する。
【0120】
例えば、談話範囲決定部340は、入力された話題検索命令信号に含まれる第一形態素情報が(面白い映画;*;ある){面白い映画はある?}である場合には、この第一形態素情報と談話範囲群とを照合し、談話範囲群に第一形態素情報を構成する形態素(例えば”映画”)が含まれているときは、第一形態素情報に含まれる”映画”を談話範囲として決定する。この場合、談話範囲決定部340は、第一形態素情報に談話範囲”映画”が含まれているので、入力された第一形態素情報を話題検索命令信号に含めて話題検索部360に出力する。
【0121】
一方、談話範囲決定部340は、第一形態素情報に談話範囲群が含まれていない場合には、入力された第一形態素情報を話題検索命令信号に含めて省略文補完部350に出力する。
【0122】
これにより、後述する話題検索部360は、談話範囲決定部340で決定された”談話範囲”に属する各「話題タイトル」と、文構造解析部430で特定された第一形態素情報とを照合することができるので、”全て”の「話題タイトル」(第二形態素情報)と第一形態素情報とを照合する必要がなくなり、後述する回答文検索部370は、最終的な回答文を検索するまでの時間を短縮することができる。
【0123】
尚、談話範囲決定部340は、上記の如く、第一形態素情報と談話範囲群とを照合し、談話範囲群に第一形態素情報の形態素が含まれていれば、その形態素を談話範囲として決定していたが、これに限定されるものではなく、鸚鵡返し判定部330で直前に検索された鸚鵡返し要素の形態素、又は利用者が発話した発話内容を構成する形態素を談話範囲として決定しても良い。後述する省略文補完部350は、上記談話範囲決定部340で決定された談話範囲を用いて、その談話範囲を、形態素が省略されている第一形態素情報に付加することができる。
【0124】
省略文補完部350は、文節解析部420で抽出された第一形態素情報に基づいて第一形態素情報を構成する各属性(サブジェクト、オブジェクト、アクションなど)の中から、形態素を含まない属性を検索する属性検索手段である。また、省略文補完部350は、検索した属性に基づいて、属性に、談話範囲決定部340で検索された談話範囲を構成する形態素を付加する形態素付加手段でもある。
【0125】
具体的に、談話範囲決定部340から話題検索命令信号が入力された省略文補完部350は、入力された談話検索命令信号に含まれる第一形態素情報に基づいて、第一形態素情報からなる発話内容が省略文であるかを判定し、第一形態素情報からなる発話内容が省略文である場合には、第一形態素情報が属する談話範囲の形態素を、第一形態素情報に付加する。
【0126】
例えば、省略文補完部350は、入力された話題検索命令信号に含まれる第一形態素情報を構成する形態素が(監督;*;*)(監督は?)(この文は、”何の”監督であるかが不明であるので、省略文を意味する。)である場合には、談話範囲決定部340で決定された談話範囲(A映画名;このA映画名は映画のタイトルを示すものである)に属する第一形態素情報であれば、第一形態素情報を構成する形態素に、決定された談話範囲(A映画名)を第一形態素情報に付加(”A映画名”の監督;*;*)する。
【0127】
即ち、第一形態素情報をW、決定された談話範囲をDとすると、省略文補完部350は、Wに談話範囲Dを付加し、付加後の第一形態素情報を話題検索命令信号に含めて話題検索部360に出力する。
【0128】
これにより、第一形態素情報が省略文であり、日本語として明解でない場合であっても、省略文補完部350は、第一形態素情報がある談話範囲に属している場合には、例えば、その談話範囲D(A映画名)を第一形態素情報W(監督;*;*)に付加し、第一形態素情報をW’(A映画名の監督;*;*){A映画名の監督は?}として扱うことができるので、利用者の発話内容が省略文である場合であっても、前に決定された談話範囲に基づいて省略文を補完することができ、省略文を明確にすることができる。
【0129】
このため、省略文補完部350が、第一形態素情報を構成する発話内容が省略文であっても、第一形態素情報を構成する発話内容が適正な日本語となるように、第一形態素情報に特定の形態素を補完することができるので、話題検索部360は、補完後の第一形態素情報に基づいて、第一形態素情報に関連する最適な「話題タイトル」(第二形態素情報)を取得することができ、回答文検索部370は、話題検索部360で取得された「話題タイトル」に基づいて利用者の発話内容により適した回答内容を出力することができる。
【0130】
話題検索部360は、文節解析部420で抽出された第一形態素情報又は省略文補完部350で補完された第一形態素情報と、各第二形態素情報とを照合し、各第二形態素情報の中から、第一形態素情報を構成する形態素を含む第二形態素情報を検索する第一検索手段である。
【0131】
具体的に、談話範囲決定部340又は省略文補完部350から話題検索命令信号が入力された話題検索部360は、入力された話題検索命令信号に含まれる第一形態素情報に基づいて、談話範囲決定部340で決定された談話範囲に属する各「話題タイトル」(第二形態素情報)の中から、第一形態素情報の形態素を含む「話題タイトル」を検索し、この検索結果を検索結果信号として回答文検索部370及び発話種類判定部440に出力する。
【0132】
例えば、第一形態素情報を構成する「格構成」が(佐藤;*;好きだ){佐藤は好きだ}である場合には、話題検索部360は、図12に示すように、上記「格構成」に属する各形態素(佐藤;*;好きだ)と談話範囲(佐藤)に属する各話題タイトル1−1〜1−4とを照合し、各話題タイトル1−1〜1−4の中から「格構成」に属する各形態素(佐藤;*;好きだ)と一致(又は近似)する話題タイトル1−1(佐藤;*;好きだ)を検索し、この検索結果を検索結果信号として回答文検索部370及び発話種類判定部440に出力する。
【0133】
話題検索部360から検索結果信号が入力された発話種類判定部440は、入力された検索結果信号に基づいて、該当する利用者に対して回答する特定の回答文を検索させるための回答検索命令信号(この回答検索命令信号には、判定した「発話文のタイプ」も含まれる)を回答文検索部370に出力する。
【0134】
回答文検索部370は、話題検索部360で検索された第二形態素情報(話題タイトル)に基づいて、第二形態素情報に関連付けられた回答文を取得する回答取得手段である。また、回答文検索部370は、話題検索部360で検索された第二形態素情報に基づいて、特定された利用者の発話種類と第二形態素情報に関連付けられた各回答種類とを照合し、各回答種類の中から、利用者の発話種類と一致する回答種類を検索する第二検索手段でもある。
【0135】
具体的に、話題検索部360から検索結果信号と、発話種類判定部440から回答検索命令信号とが入力された回答文検索部370は、入力された検索結果信号に対応する話題タイトル(検索結果によるもの;第二形態素情報)と回答検索命令信号に対応する「発話文のタイプ」(発話種類)とに基づいて、その「話題タイトル」に関連付けられている回答文群(各回答内容)の中から、「発話文のタイプ」(DA、IA、CAなど)と一致する回答種類(この回答種類は、図11に示す「回答文のタイプ」を意味する)からなる回答文を検索する。
【0136】
例えば、回答文検索部370は、検索結果に対応する話題タイトルが図12に示す話題タイトル1−1(佐藤;*;好きだ)である場合は、その話題タイトル1−1に関連付けられている回答文1−1(DA、IA、CAなど)の中から、発話種類判定部440で判定された「発話文のタイプ」(例えばDA;発話種類)と一致する回答種類(DA)からなる回答文1−1(DA;(私も)佐藤が好きです)を検索し、この検索した回答文を回答文信号として管理部310に出力する。
【0137】
回答文検索部370から回答文信号が入力された管理部310は、入力された回答文信号を出力部600に出力する。また、反射的判定部320から反射要素情報、又は鸚鵡返し判定部330から鸚鵡返し処理の内容が入力された管理部310は、入力された反射要素情報に対応する回答文、入力された鸚鵡返し処理の内容に対応する回答文を出力部600に出力する。
【0138】
出力部600は、回答文検索部370で取得された回答文を出力する出力手段であり、本実施形態では、例えば、スピーカ、ディスプレイなどが挙げられる。具体的に、管理部310から回答文が入力された出力部600は、入力された回答文{例えば、私も佐藤が好きです}を出力する。
【0139】
[会話制御装置を用いた会話制御方法]
上記構成を有する会話制御装置1による会話制御方法は、以下の手順により実施することができる。図15は、本実施形態に係る会話制御方法の手順を示すフロー図である。
【0140】
先ず、入力部100が、利用者からの発話内容を取得するステップを行う(S101)。具体的に入力部100は、利用者の発話内容を構成する音声を取得し、取得した音声を音声信号として音声認識部200に出力する。また、入力部100は、利用者から入力された入力情報(音声以外)に基づいて、入力情報(音声以外)に対応する文字列を特定し、特定した文字列を文字列信号として会話制御部300に出力する。
【0141】
次いで、音声認識部200が、入力部100で取得した発話内容に基づいて、発話内容に対応する文字列を特定するステップを行う(S102)。具体的には、入力部100から音声信号が入力された音声認識部200は、入力された音声信号を解析し、解析した音声信号に対応する文字列を、音声認識辞書記憶部700に格納されている辞書を用いて特定し、特定した文字列を文字列信号として会話制御部300に出力する。
【0142】
そして、形態素抽出部410が、音声認識部200で特定された文字列に基づいて、文字列の最小単位を構成する各形態素を第一形態素情報として抽出するステップを行う(S103)。
【0143】
具体的に、管理部310から文字列信号が入力された形態素抽出部410は、入力された文字列信号に対応する文字列と、形態素データベース450に予め格納されている名詞、形容詞、動詞などの形態素群とを照合し、文字列の中から形態素群と一致する各形態素(m1、m2、・・・)を抽出し、抽出した各形態素を抽出信号として文節解析部420に出力する。
【0144】
そして、文節解析部420は、形態素抽出部410で抽出された各形態素に基づいて、各形態素を文節形式にまとめるステップを行う(S104)。具体的に、形態素抽出部410から抽出信号が入力された文節解析部420は、入力された抽出信号に対応する各形態素を用いて文節形式にまとめる。
【0145】
即ち、文節解析部420は、図4に示すように、入力された抽出信号に対応する各形態素に基づいて各形態素の係り受け要素(例えば、が・は・を・・)を抽出し、抽出した係り受け要素に基づいて各形態素を各文節にまとめることを行う。
【0146】
各形態素を各文節にまとめた文節解析部420は、各形態素をまとめた各文節と、各文節を構成する各形態素とを含む文型情報を文型信号として文構造解析部430及び発話種類判定部440に出力する。
【0147】
その後、文構造解析部430が、文節解析部420で分節された第一形態素情報の各形態素を主体格、対象格などの各属性に分類するステップを行う(S105)。具体的に、文節解析部420から文型信号が入力された文構造解析部430は、入力された文型信号に対応する各形態素と各形態素からなる文節とに基づいて、文節に含まれる各形態素の「格構成」を決定する。
【0148】
即ち、文構造解析部430は、図5に示すように、例えば、各形態素の係り受け要素が”が”又は”は”である場合は、その係り受け要素の前にある形態素がサブジェクト(主語又は主格)であると判断する。また、文構造解析部430は、例えば、各形態素の係り受け要素が”の”又は”を”である場合は、その係り受け要素の前にある形態素がオブジェクト(対象)であると判断する。
【0149】
更に、文構造解析部430は、例えば、各形態素の係り受け要素が”する”である場合は、その係り受け要素の前にある形態素がアクション(述語;この述語は動詞、形容詞などから構成される)であると判断する。
【0150】
各文節を構成する各形態素の「格構成」を決定した文構造解析部430は、決定した「格構成」に対応付けられた第一形態素情報に基づいて、後述する話題(トピック)の範囲を特定させるための話題検索命令信号を話題検索部360に出力する。
【0151】
次いで、発話種類判定部440は、文節解析部420で特定された文節に基づいて、発話内容の種類を示す発話種類を特定するステップを行う(S106)。具体的に、文節解析部420から入力された文型信号に対応する各形態素と各形態素から構成される文節とに基づいて、「発話文のタイプ」(発話種類)を判定する。
【0152】
即ち、発話種類判定部440は、入力された文型信号に対応する各文節に基づいて、その各文節と発話種類データベース460に格納されている各辞書とを照合し、各文節の中から、各辞書に関係する文要素を抽出する。各文節の中から各辞書に関係する文要素を抽出した発話種類判定部440は、抽出した文要素に基づいて、「発話文のタイプ」を判定する。
【0153】
この発話種類判定部440は、後述する話題検索部360からの指示に基づいて、該当する利用者に特定の回答文を検索させるための回答検索命令信号を回答文検索部370に出力する。
【0154】
次いで、反射的判定部320が、形態素抽出部410で抽出された第一形態素情報と各定型内容を照合し、各定型内容の中から、第一形態素情報を含む定型内容を検索するステップを行う(S107;反射的処理)。
【0155】
具体的に、文構造解析部430から話題検索命令信号が入力された反射的判定部320は、入力された話題検索命令信号に含まれる第一形態素情報と反射要素データベース801に記憶されている各反射要素情報(定型内容)とを照合し、各反射要素情報の中から、第一形態素情報を含む反射要素情報を検索し、検索した反射要素情報を管理部310に出力する。
【0156】
反射的判定部320は、各反射要素情報の中から、第一形態素情報を含む反射要素情報を検索することができない場合には、文構造解析部430から入力された話題検索命令信号を鸚鵡返し判定部330に出力する。
【0157】
次いで、鸚鵡返し判定部330が、形態素抽出部410で抽出された第一形態素情報と各鸚鵡返し要素を照合し、各鸚鵡返し要素の中から、第一形態素情報を含む鸚鵡返し要素を検索するステップを行う(S108;鸚鵡返し処理)。
【0158】
鸚鵡返し判定部330は、各鸚鵡返し要素の中に第一形態素情報が含まれていると判断した場合には、第一形態素情報を含む鸚鵡返し要素を取得し、取得した鸚鵡返し要素からなる回答文を管理部310に出力(鸚鵡返し処理)する。即ち、鸚鵡返し要素(前回出力された回答文、前回利用者が発話した発話内容など)をS、第一形態素情報をWとすると、鸚鵡返し判定部330は、W⊂S、W≠φの関係が成立している場合には、上記に示す鸚鵡返し処理を行う。
【0159】
一方、鸚鵡返し判定部330は、各鸚鵡返し要素の中に第一形態素情報が含まれていないと判断した場合には、反射的判定部320から入力された話題検索命令信号を談話範囲決定部340に出力する。
【0160】
そして、談話範囲決定部340が、文節解析部420で抽出された第一形態素と各談話範囲とを照合し、各談話範囲の中から、第一形態素情報を含む談話範囲を検索(決定)するステップを行う(S109)。
【0161】
具体的に、鸚鵡返し判定部330から話題検索命令信号が入力された談話範囲決定部340は、入力された検索命令信号に基づいて、会話データベース500の中から、利用者が発話している内容について関連性のある範囲(談話範囲)を検索する。
【0162】
例えば、談話範囲決定部340は、入力された話題検索命令信号に含まれる第一形態素情報が(面白い映画;*;ある){面白い映画はある?}である場合には、この第一形態素情報と談話範囲群とを照合し、談話範囲群に第一形態素情報を構成する形態素(例えば”映画”)が含まれているときは、第一形態素情報に含まれる”映画”を談話範囲として決定する。この場合、談話範囲決定部340は、第一形態素情報に談話範囲”映画”が含まれているので、入力された第一形態素情報を話題検索命令信号に含めて話題検索部360に出力する。
【0163】
一方、談話範囲決定部340は、第一形態素情報に談話範囲群が含まれていない場合には、入力された第一形態素情報を話題検索命令信号に含めて省略文補完部350に出力する。
【0164】
次いで、省略文補完部350が、文節解析部420で抽出された第一形態素情報に基づいて第一形態素情報を構成する各属性(サブジェクト、オブジェクト、アクションなど)の中から、形態素を含まない属性を検索するステップを行う。その後、省略文補完部350が、検索した形態素を含まない属性に基づいて、その属性に、談話範囲決定部340で検索された談話範囲を構成する形態素を付加するステップを行う(S110;省略文を補完)。
【0165】
具体的に、談話範囲決定部340から話題検索命令信号が入力された省略文補完部350は、入力された談話検索命令信号に含まれる第一形態素情報に基づいて、第一形態素情報からなる発話内容が省略文であるかを判定し、第一形態素情報からなる発話内容が省略文である場合には、第一形態素情報が属する談話範囲の形態素を、第一形態素情報に付加する。
【0166】
例えば、省略文補完部350は、入力された話題検索命令信号に含まれる第一形態素情報を構成する形態素が(監督;*;*)(監督は?)(この文は、”何の”監督であるかが不明であるので、省略文を意味する。)である場合には、前に談話範囲決定部340で決定された談話範囲(A映画名;このA映画名とは映画のタイトルを示すものである)に属する第一形態素情報であれば、第一形態素情報を構成する形態素に、決定された談話範囲の形態素(A映画名)を第一形態素情報に付加(”A映画名”の監督;*;*)する。
【0167】
即ち、第一形態素情報をW、決定された談話範囲をDとすると、省略文補完部350は、第一形態素情報Wに談話範囲Dを付加し、付加後の第一形態素情報を話題検索命令信号に含めて話題検索部360に出力する。
【0168】
次いで、話題検索部360が、文節解析部420で抽出された第一形態素情報又は省略文補完部350で補完された第一形態素情報と、各第二形態素情報とを照合し、各第二形態素情報の中から、第一形態素情報を構成する形態素を含む第二形態素情報を検索するステップを行う(S111)。
【0169】
具体的に、談話範囲決定部340又は省略文補完部350から話題検索命令信号が入力された話題検索部360は、入力された話題検索命令信号に含まれる第一形態素情報に基づいて、談話範囲決定部340で決定された談話範囲に属する各「話題タイトル」(第二形態素情報)の中から、第一形態素情報の形態素を含む「話題タイトル」を検索し、この検索結果を検索結果信号として回答文検索部370及び発話種類判定部440に出力する。
【0170】
例えば、第一形態素情報を構成する「格構成」が(佐藤;*;好きだ){佐藤は好きだ}である場合には、話題検索部360は、図12に示すように、上記「格構成」に属する各形態素(佐藤;*;好きだ)と談話範囲(佐藤)に属する各話題タイトル1−1〜1−4とを照合し、各話題タイトル1−1〜1−4の中から「格構成」に属する各形態素(佐藤;*;好きだ)と一致(又は近似)する話題タイトル1−1(佐藤;*;好きだ)を検索し、この検索結果を検索結果信号として回答文検索部370及び発話種類判定部440に出力する。
【0171】
話題検索部360から検索結果信号が入力された発話種類判定部440は、入力された検索結果信号に基づいて、該当する利用者に対して回答する特定の回答文を検索させるための回答検索命令信号(この回答検索命令信号には、判定した「発話文のタイプ」も含まれる)を回答文検索部370に出力する。
【0172】
そして、回答文検索部370が、話題検索部360で検索された第二形態素情報に基づいて、特定された利用者の発話種類と第二形態素情報に関連付けられた各回答種類とを照合し、各回答種類の中から、利用者の発話種類と一致する回答種類を検索し、検索した回答種類に基づいて回答種類に関連付けられている回答文を取得するステップを行う(S112)。
【0173】
具体的に、話題検索部360から検索結果信号と、発話種類判定部440から回答検索命令信号とが入力された回答文検索部370は、入力された検索結果信号に対応する話題タイトル(検索結果によるもの;第二形態素情報)と回答検索命令信号に対応する「発話文のタイプ」(発話種類)とに基づいて、その「話題タイトル」に関連付けられている回答文群(各回答内容)の中から、「発話文のタイプ」(DA、IA、CAなど)と一致する回答種類(この回答種類は、図11に示す「回答文のタイプ」を意味する)からなる回答文を検索する。
【0174】
例えば、回答文検索部370は、検索結果に対応する話題タイトルが図12に示す話題タイトル1−1(佐藤;*;好きだ)である場合は、その話題タイトル1−1に関連付けられている回答文1−1(DA、IA、CAなど)の中から、発話種類判定部440で判定された「発話文のタイプ」(例えばDA;発話種類)と一致する回答種類(DA)からなる回答文1−1(DA;(私も)佐藤が好きです)を検索し、この検索した回答文を回答文信号として管理部310に出力する。
【0175】
次いで、回答文検索部370から回答文信号が入力された管理部310は、入力された回答文信号を出力部600に出力する。また、反射的判定部320から反射要素情報、又は鸚鵡返し判定部330から鸚鵡返し処理の内容が入力された管理部310は、入力された反射要素情報に対応する回答文、入力された鸚鵡返し処理の内容に対応する回答文を出力部600に出力する(S113)。管理部310から回答文が入力された出力部600は、入力された回答文{例えば、私も佐藤が好きです}を出力する。
【0176】
[会話制御装置及び会話制御方法による作用及び効果]
上記構成を有する本願に係る発明によれば、反射的判定部320が、利用者から発話された発話内容を構成する第一形態素情報と予め記憶された各定型内容とを照合し、各定型内容の中から、第一形態素情報を含む定型内容を検索することができるので、反射的判定部320は、例えば第一形態素情報が”こんにちは”などの定型内容である場合には、この定型内容と同一の定型内容”こんにちは”等を回答することができる。
【0177】
また、反射的判定部320は、利用者の発話内容が定型内容である場合には、その定型内容(挨拶など)を回答するので、利用者は、最初に、会話制御装置1との間で意思の疎通をしているような感覚を味わうことができる。
【0178】
また、鸚鵡返し判定部330が、現在の第一形態素情報と過去の回答内容とを照合し、現在の第一形態素情報が過去の回答内容に含まれていない場合には、予め記憶してある合意内容を取得することができるので、鸚鵡返し判定部330は、利用者から現在入力された入力情報と過去の回答内容とが一致していれば、利用者が過去の回答内容に対して鸚鵡返し(利用者が回答内容に対して聞き直していること)の入力情報を入力したものと断定することができる。
【0179】
この場合、鸚鵡返し判定部330は、利用者が過去の回答内容に対して鸚鵡返しを行っているので、記憶されている合意内容を取得し、取得した合意内容(例えば、”その通りです”など)を出力することができる。これにより、利用者は、会話制御装置1から出力された回答内容の意味が分からなければ、もう一度聞き直して、再度回答内容を聞き直すことができるので、恰も他の利用者と会話しているような感覚を味わうことができる。
【0180】
また、鸚鵡返し判定部330が、現在の第一形態素情報と過去の第一形態素情報とを照合し、現在の第一形態素情報が過去の第一形態素情報に含まれる場合には、反発内容を取得することができるので、鸚鵡返し判定部330は、前回入力された入力情報が今回入力された入力情報に含まれている場合には、利用者が前の入力情報と同一の内容を反復して入力したものと判断することができ、利用者が会話制御装置からの回答内容に対して適切に回答していないものと断定することができる。
【0181】
この場合、鸚鵡返し判定部330は、利用者が前回の回答内容に対して適切に回答していないので、利用者に対して反発するため、記憶されている反発内容を取得し、取得した反発内容を出力する。これにより、利用者は、会話制御装置1からの回答内容に対して適切な入力情報を入力しなければ、会話制御装置1から反発内容が出力されるので、恰も他の利用者と会話しているような感覚を味わうことができる。
【0182】
また、話題検索部360は、第一形態素情報と近似する第二形態素情報を検索するには、”談話範囲”に属する各第二形態素情報と第一形態素情報とを照合すればよく、”全て”の第二形態素情報と第一形態素情報とを照合する必要がないので、第一形態素情報と近似している第二形態素情報を検索するまでの時間を短縮することができる。
【0183】
この結果、話題検索部360が、第一形態素情報と近似している第二形態素情報を短時間で検索(ピンポイント検索)することができるので、回答文検索部370は、話題検索部360で検索された第二形態素情報に基づいて第二形態素情報に関連付けられている回答文を短時間で取得することができ、会話制御装置1は、利用者からの発話内容に対して迅速に回答することができる。
【0184】
また、話題検索部360が、各第二形態素情報の中から、第一形態素情報を構成する形態素(利用者の発話内容を構成する要素)を含む第二形態素情報を検索し、回答文検索部370が、話題検索部360で検索された第二形態素情報に基づいて、第二形態素情報に関連付けられた回答内容を取得することができるので、回答文検索部370は、利用者の発話内容を構成する各形態素(第一形態素情報)に基づいて、各形態素により構築される意味空間(主体、対象等)を考慮し、かかる意味空間に基づいて予め作成された回答内容を取得することができることとなり、単に発話内容の全体をキーワードとして、そのキーワードに関連付けられた回答内容を取得するよりも、より発話内容に適した回答内容を取得することができる。
【0185】
また、話題検索部360は、第一形態素情報を含む第二形態素情報を検索するので、利用者の発話内容と完全に一致する第二形態素情報を検索する必要がなく、会話制御装置1を開発する開発者は、利用者から発話されるであろう発話内容に対応する膨大な回答内容を予め記憶する必要がなくなり、記憶部の容量を低減させることができる。
【0186】
更に、回答文検索部370が、”談話範囲”に属する各第二形態素情報に関連付けられた回答種類(陳述、肯定、場所、反発など)の中から、利用者の発話種類と一致する回答種類を検索し、検索した回答種類に基づいて回答種類に対応付けられた回答内容を取得することができるので、会話制御装置1は、利用者の会話内容を構成する発話種類、例えば、利用者が単に意見を述べたもの、利用者が抱く感想からなるもの、利用者が場所的な要素を述べたものなどに基づいて、複数の回答内容の中から利用者の発話種類にマッチした回答内容を取得することができることとなり、該当する利用者に対してより最適な回答をすることができる。
【0187】
更にまた、回答文検索部370は、談話範囲決定部340で検索された”談話範囲”にのみ属する各第二形態素情報に関連付けられた回答種類の中から、利用者の発話種類と一致する回答種類を検索(ピンポイント検索が可能)するだけでよいので、”全て”の第二形態素情報に関連付けられた回答種類と利用者の発話種類とを逐一検索する必要がなくなり、利用者の発話種類に対応する最適な回答内容を短時間で取得することができる。
【0188】
最後に、省略文補完部350は、利用者の発話内容を構成する第一形態素情報が省略文であり、日本語として明解でない場合であっても、第一形態素情報がある談話範囲に属している場合には、その談話範囲を第一形態素情報に付加し、省略文からなる第一形態素情報を補完することができる。
【0189】
これにより、省略文補完部350は、第一形態素情報を構成する発話内容が省略文であっても、第一形態素情報を構成する発話内容が適正な日本語となるように、第一形態素情報に特定の形態素(談話範囲を構成する形態素など)を補完することができるので、話題検索部360は、省略文補完部350で補完された補完後の第一形態素情報に基づいて、第一形態素情報に関連する最適な第二形態素情報を取得することができ、回答文検索部370は、話題検索部360で取得された第二形態素情報に基づいて利用者の発話内容により適した回答内容を出力することができる。
【0190】
この結果、会話制御装置1は、利用者からの入力情報が省略文であったとしても、ニューロネットワーク、AI知能などの機能を用いることなく、過去の検索結果を通じて、その省略文が何を意味するのかを推論することができ、会話制御装置1の開発者は、ニューロネットワーク、AI知能を搭載する必要がないので、会話制御装置1のシステムをより簡便に構築することができる。
【0191】
[変更例]
尚、本発明は、上記実施形態に限定されるものではなく、以下に示すような変更を加えることができる。
【0192】
(第一変更例)
本変更例においては、会話データベース500は、複数の形態素の集合からなる集合群の全体を示す要素情報を、集合群に関連付けて複数記憶する要素記憶手段であってもよい。更に、形態素抽出部410は、文字列から抽出した形態素と各集合群とを照合し、各集合群中から、抽出された形態素を含む集合群を選択し、選択した集合群に関連付けられた要素情報を第一形態素情報として抽出してもよい。
【0193】
図16に示すように、利用者が発話した文字列に含まれる各形態素には、類似しているものがある。例えば、図16に示すように、集合群の全体を示す要素情報を「贈答」とすると、「贈答」は、プレゼント、贈り物、御歳暮、御中元、お祝いなど(集合群)と相互に類似しているので、形態素抽出部410は、「贈答」に類似する形態素(上記のプレゼントなど)がある場合には、その類似する形態素については、「贈答」として取り扱うことができる。
【0194】
即ち、形態素抽出部410は、例えば、文字列から抽出した形態素が「プレゼント」である場合には、図16に示すように、「プレゼント」を代表する要素情報が「贈答」であるので、上記「プレゼント」を「贈答」に置き換えることができる。
【0195】
これにより、形態素抽出部410が相互に類似する形態素を整理することができるので、会話制御装置を開発する開発者は、相互に類似した各第一形態素情報から把握される意味空間に対応した第二形態素情報及び第二形態素情報に関係する回答内容を逐一作成する必要がなくなり、結果的に、記憶部に格納させるデータ量を低減させることができる。
【0196】
(第二変更例)
図17に示すように、本変更例においては、割合計算部361と、選択部362とを話題検索部360に備えてもよい。
【0197】
割合計算部361は、形態素抽出部410で抽出された第一形態素情報と各第二情報とを照合し、各第二形態素情報毎に、第二形態素情報に対して第一形態素情報が占める割合を計算する計算手段である。
【0198】
具体的に、文構造解析部430から話題検索命令信号が入力された割合計算部361は、図17に示すように、入力された話題検索命令信号に含まれる第一形態素情報に基づいて、第一形態素情報と会話データベース500に格納されている談話範囲に属する各話題タイトル(第二形態素情報)とを照合し、各話題タイトル毎に、それぞれの話題タイトルの中に、第一形態素情報が占める割合を計算する。
【0199】
例えば、図18に示すように、利用者から発話された発話文を構成する第一形態素情報が(佐藤;*;好きだ){佐藤は好きだ}である場合は、割合計算部361は、「格構成」に属する各形態素(佐藤;*;好きだ)と話題タイトルに含まれる各形態素(佐藤;*;好きだ)とを照合し、上記話題タイトルに、「格構成」に属する各形態素(佐藤;*;好きだ)が含まれる割合を、100%であると計算する。割合計算部361は、これらの計算を話題タイトル毎に行い、計算した各割合を割合信号として選択部362に出力する。
【0200】
選択部362は、割合計算部361で各第二形態素情報毎に計算された各割合の大きさに応じて、各第二形態素情報の中から、一の第二形態素情報を選択する選択手段である。
【0201】
具体的に、割合計算部361から割合信号が入力された選択部362は、入力された割合信号に含まれる各割合(「格構成」の要素/「話題タイトル」の要素×100)の中から、例えば割合の高い話題タイトルを選択する(図18参照)。割合の高い話題タイトルを選択した選択部362は、選択した話題タイトルを検索結果信号として回答文検索部370及び発話種類判定部440に出力する。回答文検索部370は、選択部362で選択された話題タイトルに基づいて、話題タイトルに関連付けられた回答文を取得する。
【0202】
これにより、選択部362が、各第二形態素情報毎に、第二形態素情報に対して該第一形態素情報が占める割合を計算し、各第二形態素情報毎に計算された各割合の大きさに応じて、各第二形態素情報の中から、一の第二形態素情報を選択することができるので、選択部362は、例えば、第一形態素情報(利用者の発話内容を構成するもの)が第二形態素情報に占める割合の大きい第二形態素情報を、複数ある第二形態素情報群の中から取得することができれば、第一形態素情報から把握される意味空間を踏襲した第二形態素情報をより的確に取得することができ、結果的に、回答文検索部370は、利用者の発話内容に対して最適な回答をすることができる。
【0203】
また、選択部362は、複数の話題タイトルの中から、割合計算部361で計算された割合の高い話題タイトルを選択することができるので、利用者の発話文に含まれる「格構成」に属する各形態素と会話データベース500に格納されている各話題タイトルとが完全に一致しなくても、「格構成」に属する各形態素に密接する話題タイトルを取得することができる。
【0204】
この結果、選択部362が第一形態素情報を構成する「格構成」に密接する話題タイトルを取得することができるので、会話制御装置1を開発する開発者は、第一形態素情報を構成する「格構成」と完全に一致する話題タイトルを会話データベース500に逐一格納する必要がなくなるので、会話データベース500の容量を低減させることができる。
【0205】
更に、割合計算部361は、談話範囲決定部340で検索された”談話範囲”にのみ属する各第二形態素情報毎に、第二形態素情報に対して該第一形態素情報が占める割合を計算するので、”全て”の第二形態素情報に対して第一形態素情報が占める割合を計算する必要がなくなり、第一形態素情報から構成される意味空間を踏襲した第二形態素情報をより短時間で取得することができ、結果的に、取得した第二形態素情報に基づいて利用者からの発話内容に対しての最適な回答内容を迅速に出力することができる。
【0206】
尚、割合計算部361は、分類された各属性に属する第一形態素情報の各形態素と、予め記憶された各属性に属する各第二形態素情報の各形態素とを各属性毎に照合し、各第二形態素情報の中から、少なくとも一の属性に第一形態素情報の各形態素を含む第二形態素情報を検索する第一検索手段であってもよい。
【0207】
具体的に、話題検索命令信号が入力された割合計算部361は、入力された話題検索命令信号に含まれる「格構成」の各「格」(サブジェクト;オブジェクト;アクション)毎に、その「格」に属する各形態素と、同一の「格」からなる話題タイトルの「格」に属する各形態素とを照合し、互いの「格」を構成する形態素が同一か否かを判定する。
【0208】
例えば、図19に示すように、割合計算部361は、「格構成」の「格」の形態素が(犬;人;噛んだ){犬が人を噛んだ}である場合は、それらの形態素”犬”、”人”、”噛んだ”と、それらの形態素を構成する「格」と同一の「格」からなる話題タイトルの形態素”犬”、”人”、”噛んだ”とを照合し、話題タイトルを構成する各形態素”犬”、”人”、”噛んだ”のうち、各形態素に対応する「格」と同一の「格」からなる「格構成」の形態素”犬”、”人”、”噛んだ”と一致している割合を算出(100%)する。
【0209】
もし、話題タイトルを構成する要素が(人;犬;噛んだ){人が犬を噛んだ}である場合には、割合計算部361は、上記と同様の手順により、二つの格に属する形態素が異なるので、「格構成」を構成する形態素と「話題タイトル」との「格」毎の一致度を33%であると算出する(図19参照)。
【0210】
割合を計算した割合計算部361は、各割合の中から、割合の高い話題タイトルを選択し、選択した話題タイトルを検索結果信号として回答文検索部370及び発話種類判定部440に出力する。
【0211】
これにより、割合計算部361が、分類された各「格構成」(主体格、対象格など)に属する第一形態素情報の各形態素と、予め記憶された話題タイトルとを各「格」毎に照合し、各話題タイトルの中から、少なくとも一の「格」に第一形態素情報の各形態素を含む第二形態素情報を検索することができるので、割合計算部361は、通常の語順とは異なるものから構成される発話内容、例えば”人が犬を噛む”である場合には、主体格の形態素が”人”、対象格の形態素が”犬”であることから、その各「格」と一致する第二形態素情報を検索することができ、その第二形態素情報(人;犬;噛む)に関連付けられている回答内容{”本当に?”又は”意味がよくわかんないよ”など}を取得することができる。
【0212】
即ち、割合計算部361は、識別が困難な発話内容、例えば”人が犬を噛む”と”犬が人を噛む”とを識別することができるので、その識別した発話内容に最適な回答、前者については例えば”本当に?”、後者については例えば”大丈夫?”をすることができる。
【0213】
また、割合計算部361は、”談話範囲”に属する各第二形態素情報の中から、少なくとも一の属性に第一形態素情報の形態素を含む第二形態素情報を検索すればよいので、”全て”の第二形態素情報の中から、一の第二形態素情報を取得する必要がなくなり、第一形態素情報から構成される意味空間を踏襲した第二形態素情報をより短時間で取得することができ、結果的に、会話制御装置1は、取得した第二形態素情報に基づいて利用者からの発話内容に対しての最適な回答内容を迅速に出力することができる。
【0214】
尚、選択部362は、予め定められた優先順位に従って各話題タイトルの中から、一の話題タイトルを選択してもよい。この優先順位とは、話題タイトルとして選出されるための優先度を意味するものである。この優先順位は、開発段階で開発者が予め定めるものである。
【0215】
(第三変更例)
図20に示すように、本変更例においては、上記実施形態及び各変更例に限定されるものではなく、会話制御装置1a,1bにある通信部800と、通信ネットワーク1000を介してデータの送受信をするための通信部900と、通信部900に接続された各会話データベース500b〜500dと、サーバ2a〜2cとを備えてもよい(会話制御システム)。
【0216】
ここで、通信ネットワーク1000とは、データを送受信する通信網を意味するものであり、本実施形態では、例えば、インターネットなどが挙げられる。尚、本変更例では、便宜上、会話データベース500b〜500d、サーバ2a〜2cを限定しているが、これに限定されるものではなく、更に他の会話データベースを設けてもよい。
【0217】
これにより、会話制御部300は、会話制御装置1aの内部に配置してある会話データベース500aのみならず、その他の会話制御装置1b、他の会話データベース500b〜500d、サーバ2a〜2cをも参照することができるので、例えば、会話データベース500aの中から、話題検索命令信号に含まれる「格構成」に属する各形態素(第一形態素情報)と関連する談話範囲等を検索することができない場合であっても、その他の会話制御装置1b、会話データベース500b〜500d、サーバ2a〜2cを参照することにより、上記「格構成」と関連する談話範囲等を検索することができ、利用者の発話文により適した回答文を検索することができる。
【0218】
(第四変更例)
文構造解析部430は、特定した第一形態素情報を構成する各「格構成」及び各「格構成」に対応付けられた各形態素を会話データベース500に記憶するものであってもよい。回答文検索部370は、検索した回答文を構成する各「格構成」及び各「格構成」に対応付けられた各形態素を会話データベース500に記憶するものであってもよい。
【0219】
談話範囲決定部340は、検索した談話範囲を会話データベース500に記憶するものであってもよい。話題検索部360は、検索した第二形態素情報を会話データベース500に記憶するものであってもよい。
【0220】
上記第一形態素情報と、第二形態素情報と、第一形態素情報又は第二形態素情報を構成する各「格構成」及び各「格構成」に対応付けられた各形態素と、検索した回答文を構成する各「格構成」及び各「格構成」に対応付けられた各形態素と、検索した談話範囲とは、それらを相互に関連付けて履歴形態素情報として会話データベース500又は鸚鵡返し要素データベース802に記憶することができる。
【0221】
省略文補完部350は、文節解析部420で抽出された第一形態素情報に基づいて第一形態素情報を構成する各属性(サブジェクト、オブジェクト、アクションなど;格構成)の中から、形態素を含まない属性を検索し、検索した属性に基づいてその属性に、会話データベース500又は鸚鵡返し要素データベース802に記憶された履歴形態素情報を付加する。
【0222】
具体的に、談話範囲決定部340から話題検索命令信号が入力された省略文補完部350は、入力された談話検索命令信号に含まれる第一形態素情報に基づいて、第一形態素情報からなる発話内容が省略文であるかを判定し、第一形態素情報からなる発話内容が省略文(例えば、サブジェクト、オブジェクト、又はアクションに所定の形態素を有しないなど)である場合には、会話データベース500又は鸚鵡返し要素データベース802に記憶されている履歴形態情報を、第一形態素情報に付加する。
【0223】
即ち、履歴形態情報に含まれるサブジェクトをS1、オブジェクトをO1、アクションA1、談話範囲をD1とし、省略された第一形態素情報をWとすると、補完後の第一形態素情報W1は、S1∪W、O1∪W、A1∪W、又はD1∪Wとして表現することができる。
【0224】
話題検索部360は、省略文補完部350で補完された第一形態素情報W1と各第二形態素情報とを照合し、各「話題タイトル」(第二形態素情報)の中から、第一形態素情報W1を含む第二形態素情報を検索し、検索した話題タイトルを検索結果信号として回答文検索部370及び発話種類判定部440に出力する。
【0225】
これにより、第一形態素情報からなる発話内容が省略文であり、日本語として明解でない場合であっても、省略文補完部350は、会話データベース500に記憶されている履歴形態情報を用いて、省略された第一形態素情報の形態素を補完することができるので、省略された第一形態素情報からなる発話内容を明確にすることができる。
【0226】
このため、省略文補完部350が、第一形態素情報を構成する発話内容が省略文である場合には、第一形態素情報からなる発話内容が適正な日本語となるように、第一形態素情報に省略された形態素を補完することができるので、話題検索部360は、形態素が補完された第一形態素情報に基づいて、その第一形態素情報と関連する最適な「話題タイトル」(第二形態素情報)を取得することができ、回答文検索部370は、話題検索部360で取得された最適な「話題タイトル」に基づいて、利用者の発話内容により適した回答内容を出力することができる。
【0227】
(第五変更例)
話題検索部360は、図21に示すように、削除部361と、談話付加部362とを備えてもよい。削除部361は、検索した第二形態素情報に基づいて、第二形態素情報と談話範囲決定部340で検索された談話範囲とを照合し、第二形態素情報を構成する各形態素の中から、談話範囲と一致する形態素を削除する削除手段である。
【0228】
具体的に、省略文補完部350から話題検索命令信号が入力された話題検索部360は、入力された話題検索命令信号に含まれる第一形態素情報と、談話範囲決定部340で決定された談話範囲に属する各第二形態素情報とを照合し、各第二形態素情報の中から、第一形態素情報と一致する第二形態素情報を検索する。
【0229】
そして、削除部361は、検索された第二形態素情報に基づいて、その第二形態素情報と談話範囲決定部340で決定された談話範囲を構成する形態素とを照合し、第二形態素情報の中から、談話範囲を構成する形態素と一致する形態素を削除し、形態素が削除された第二形態素情報を削除信号として談話付加部362に出力する。
【0230】
即ち、削除部361は、第二形態素情報を構成する各形態素t1から、談話範囲決定部340で決定された現在の談話範囲D2(このD2は、形態素からなるものである)を取り除く(取り除いた結果をt2とすると、t2=t1−D2)。
【0231】
談話付加部362は、削除部361で形態素が削除された第二形態素情報に基づいて、談話範囲決定部340で検索された談話範囲に関連付けられた他の談話範囲を取得し、取得した他の談話範囲を構成する形態素を、第二形態素情報に付加する談話付加手段である。
【0232】
具体的には、現在の談話範囲D2が回答文K1と関連性のある談話範囲をDKとすると、回答文K1又は現在の談話範囲D2と関連性(兄弟関係にあるもの)のある他の談話範囲D3は、D3=D2∪DKとして表現することができるので、他の談話範囲D3を構成する形態素を付加した後の第二形態素情報W2は、W2=t2∪D3とすることができる。
【0233】
例えば、第二形態素情報を構成する各形態素t1が(A映画名;*;面白い){A映画名は面白い?}であり、談話範囲決定部340で決定された現在の談話範囲D2が(A映画名)である場合には、削除部361は、先ず、各形態素t1(A映画名;*;面白い)から談話範囲D2(A映画名)を削除し、削除した結果をt2(*;*;面白い)とする(t2=t1−D2)。
【0234】
現在の談話範囲D2(A映画名)と関連性のある他の談話範囲D3が”B映画名”である場合には、他の談話範囲D3を構成する形態素を付加した後の第二形態素情報W2は、t2∪D3であるので、(B映画名;*;面白い){B映画名は面白い?}とすることができる。
【0235】
これにより、利用者の発話内容が”A映画名は面白い?”である場合には、談話付加部362は、利用者の発話内容を構成する各形態素(A映画名;*;面白い)と一致する第二形態素情報(A映画名;*;面白い)を、他の第二形態素情報(B映画名;*;面白い){B映画名は面白い?}に変更することができるので、回答文検索部370は、談話付加部362で変更された第二形態素情報に関連付けられた回答文(例えば、”B映画名は面白いよ”)を取得し、取得した回答文を出力することができる。
【0236】
この結果、回答文検索部370は、利用者の発話内容に対する回答文を直接的に出力するわけではないが、談話付加部362で付加された形態素を含む第二形態素情報に基づいて、発話内容に関連する回答文を出力することができるので、出力部600は、回答文検索部370で検索された回答文に基づいて、さらに人間味のある回答文を出力することができる。
【0237】
尚、談話付加部362は、形態素が削除された第二形態素情報に他の談話範囲を付加するものだけに限定されるものではなく、形態素が削除された第二形態素情報に履歴形態素情報(会話データベース500に記憶されている)を付加するものであってもよい。
【0238】
(第六変更例)
話題検索部360は、各第二形態素情報の中から、第一形態素情報を含む第二形態素情報を検索することができない場合に、第一形態素情報と各回答内容とを照合し、各回答内容の中から、第一形態素情報を含む回答内容を検索することができたときは、検索した回答内容に関連付けられている第二形態素情報を取得する第一検索手段であってもよい。
【0239】
具体的に、省略文補完部350から話題検索命令信号が入力された話題検索部360は、入力された話題検索命令信号に含まれる第一形態素情報に基づいて、第一形態素情報と各第二形態素情報とを照合し、各第二形態素情報の中から、第一形態素情報と一致する第二形態素情報を取得することができない場合には、図22に示すように、第一形態素情報と、第二形態素情報に関連付けられている回答文とを照合する。
【0240】
この照合により、話題検索部360は、回答文の中に第一形態素情報を構成する形態素(アクション又はアクションに対応付けられた形態素)が含まれていると判断した場合には、その回答文に関連付けられている第二形態素情報を検索する。
【0241】
これにより、話題検索部360は、各第二形態素情報の中から、第一形態素情報と一致する第二形態素情報を検索することができなくても、各回答文の中から、第一形態素情報を構成する形態素(アクション又はアクションに対応付けられた形態素)を含む回答文を特定し、この特定した回答文に関連付けられている第二形態素情報を検索することができるので、利用者の発話内容を構成する第一形態素情報に対応する第二形態素情報を適切に検索することができる。
【0242】
この結果、話題検索部360が第一形態素情報に対応する最適な第二形態素情報を検索することができるので、回答文検索部370は、話題検索部360で検索された最適な第二形態素情報に基づいて、利用者の発話内容に対する適切な回答内容を取得することができる。
【0243】
[プログラム]
上記会話制御システム及び会話制御方法で説明した内容は、パーソナルコンピュータ等の汎用コンピュータにおいて、所定のプログラム言語を利用するための専用プログラムを実行することにより実現することができる。
【0244】
ここで、プログラム言語としては、利用者が求める話題、ある事柄に対する利用者の感情度、又は陳述文、肯定文、疑問文、反発文などの種類をその意味内容に応じて形態素と関連付けて階層的にデータベースに蓄積するための言語、本実施形態では、例えば、発明者らが開発したDKML(Discourse Knowledge Markup Language)、XML(eXtensible Markup Language)、C言語等が挙げられる。
【0245】
即ち、会話制御装置1は、各会話データベース500a〜500dに格納されているデータ(第二形態素情報、定型内容、回答文、回答種類、集合群、談話範囲、要素情報などの記憶情報)、その他の各部を、DKML(Discourse Knowledge Markup Language)、XML(eXtensible Markup Language)等で構築し、この構築した記憶情報等を利用するためのプログラムを実行することにより実現することができる。
【0246】
このような本実施形態に係るプログラムによれば、利用者の発話内容を構成する各形態素を特定し、特定した各形態素から把握される意味内容を解析して、解析した意味内容に関連付けられている予め作成された回答内容を出力することで、利用者の発話内容に対応する最適な回答内容を出力することができるという作用効果を奏する会話制御装置、会話制御システム及び会話制御方法を一般的な汎用コンピュータで容易に実現することができる。
【0247】
また、会話制御装置1を開発する開発者は、利用者の発話内容に対する回答内容を検索するための第二形態素情報等を、データベースにおいて前記言語を用いて階層的に構築することができるので、会話制御装置1は、利用者の発話内容に基づいて発話内容に対する回答内容を、階層的な手順を経てデータベースから取得することができる。
【0248】
即ち、会話制御装置1は、利用者の発話内容の階層(例えば、データベースに蓄積されている第二形態素情報に対して上位概念にあるのか、又は下位概念にあるのか)を見極めて、見極めた階層に基づいて予め蓄積された各回答内容の中から、適切な回答内容を取得することができる。
【0249】
このため、会話制御装置1は、利用者の発話内容からなる第一形態素情報と、予め記憶されている”全て”の第二形態素情報とを逐一照合することなく、ある特定の階層に属する各第二形態素情報と第一形態素情報とを照合すればよいので、第一形態素情報と近似する第二形態素情報を短時間で取得することができる。
【0250】
更に、上記通信部800と通信部900との間の通信は、通信ネットワーク1000を介して、DKML等からなるプロトコルによってデータを送受信してもよい。これにより、会話制御装置1は、例えば、会話制御装置1に利用者の発話内容に適した回答内容がない場合には、通信ネットワーク1000を通じて、DKML等の約束事に従って、利用者の発話内容に適した回答内容(DKMLなどで記述されたもの)を検索し、検索した回答内容を取得することができる(図20参照)。
【0251】
尚、プログラムは、記録媒体に記録することができる。この記録媒体は、図23に示すように、例えば、ハードディスク1100、フロッピーディスク1200、コンパクトディスク1300、ICチップ1400、カセットテープ1500などが挙げられる。このようなプログラムを記録した記録媒体によれば、プログラムの保存、運搬、販売などを容易に行うことができる。
【0252】
【発明の効果】
以上説明したように、本発明によれば、会話制御装置が、利用者の発話内容を構成する各形態素を特定し、特定した各形態素から把握される意味内容を解析して、解析した意味内容に関連付けられている予め作成された回答内容を取得することができる。この結果、会話制御装置は、利用者の発話内容に対応する最適な回答内容を取得することができる。
【図面の簡単な説明】
【図1】本実施形態に係る会話制御システムの概略構成を示すブロック図である。
【図2】本実施形態における会話制御部及び文解析部の内部構造を示すブロック図である。
【図3】本実施形態における形態素抽出部で抽出する各形態素の内容を示す図である。
【図4】本実施形態における文節解析部で抽出する各文節の内容を示す図である。
【図5】本実施形態における文構造解析部で特定する「格」の内容を示す図である。
【図6】本実施形態における発話種類判定部で特定する「発話文のタイプ」を示す図である。
【図7】本実施形態における発話種類データベースで格納する各辞書の内容を示す図である。
【図8】本実施形態における会話データベースの内部で構築される階層構造の内容を示す図である。
【図9】本実施形態における会話データベースの内部で構築される階層構造の詳細な関係を示す図である。
【図10】本実施形態における会話データベースの内部で構築される「話題タイトル」の内容を示す図である。
【図11】本実施形態における会話データベースの内部で構築される「話題タイトル」に関連付けられている「回答文のタイプ」の内容を示す図である。
【図12】本実施形態における会話データベースの内部で構築される「談話範囲」に属する「話題タイトル」及び「回答文」の内容を示す図である。
【図13】本実施形態における反射要素データベースで記憶する反射要素情報の内容を示す図である。
【図14】本実施形態における鸚鵡返し要素データベースで記憶する鸚鵡返し要素、鸚鵡返し要素の形態素の内容を示す図である。
【図15】本実施形態に係る会話制御方法の手順を示すフロー図である。
【図16】第一変更例における形態素抽出部で整理する発話内容を示す図である。
【図17】第二変更例における話題検索部の内部構成を示す図である。
【図18】第二変更例における割合計算部が「格構成」に属する各形態素と各「話題タイトル」とを「話題タイトル」毎に照合する様子を示す図である。
【図19】第二変更例における割合計算部が「各構成」に属する各形態素と「話題タイトル」に属する各形態素とを「格」毎に照合する様子を示す図である。
【図20】第三変更例における会話制御システムの概略構成を示す図である。
【図21】第五変更例における話題検索部の内部構成を示す図である。
【図22】第六変更例における話題検索部が第一形態素情報と、第二形態素情報又は回答文とを照合する様子を示す図である。
【図23】本実施形態におけるプログラムを格納する記録媒体を示す図である。
【符号の説明】
1…会話制御装置、100…入力部、200…音声認識部、300…会話制御部、310…管理部、320…反射的判定部、321…割合計算部、322…選択部、330…判定部、340…談話範囲決定部、350…省略文補完部、360…話題検索部、361…削除部、362…談話付加部、370…回答文検索部、400…文解析部、410…形態素抽出部、420…文節解析部、430…文構造解析部、440…発話種類判定部、450…形態素データベース、460…発話種類データベース、500a〜500d…会話データベース、600…出力部、700…音声認識辞書記憶部、800…通信部、801…反射要素データベース、802…鸚鵡返し要素データベース、900…通信部、1000…通信ネットワーク、1100…ハードディスク、1200…フロッピーディスク、1300…コンパクトディスク、1400…ICチップ、1500…カセットテープ
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a conversation control system, a conversation control device, a conversation control method, a program, and a recording medium on which the program is recorded, which outputs an answer suitable for the input information based on input information from a user.
[0002]
[Prior art]
In the conventional conversation control system, since the answer contents stored in advance corresponding to the input information are output based on the input information from the user, the user can select the answer contents to be answered from the conversation control system. I was able to enjoy the feeling of talking with other users in a pseudo manner.
[0003]
[Problems to be solved by the invention]
However, in the conversation control system, the input information from the user is collated with the user input information (phrase) group stored in advance, and a phrase that matches the input information is searched from the phrase group. Since the answer contents associated with the searched phrase are output, if there are not many phrases that are as close as possible to the above input information, the answer contents more suitable for the input information can be output. There wasn't.
[0004]
On the other hand, if the developer who constructs the conversation control system stores in the conversation control system in advance a huge number of phrases that are as close as possible to the input information and the answer contents associated with the large number of phrases, the conversation control system Can search for a phrase that matches the input information from a huge group of phrases stored in advance, and output the answer contents associated with the searched phrase, so that the answer is more suitable for the input information. The contents can be output.
[0005]
However, a developer who builds a conversation control system can search for a phrase that matches the input information using the conversation control system. Must be stored in the conversation control system in advance, and it is difficult to construct a conversation control system that outputs answer contents more suitable for input information.
[0006]
Therefore, the present application has been made in view of the above points, and identifies each morpheme constituting user input information, analyzes the semantic content grasped from each identified morpheme, and converts it into the analyzed semantic content. By outputting the associated response contents created in advance, the optimal response contents corresponding to the user's input information are output, and the appropriate response contents are output even if each response content stored in advance is reduced. An object is to provide a conversation control system, a conversation control device, a conversation control method, a program, and a recording medium on which the program is recorded.
[0007]
[Means for Solving the Problems]
The invention according to the present application has been made to solve the above-described problem, and based on the input information input from the user, the input input from the user when obtaining an answer suitable for the input information. A character string indicating input information is specified based on the information, and each morpheme constituting the minimum unit of the character string is extracted as first morpheme information based on the specified character string, and the input information from the user is A plurality of fixed contents for answering the fixed contents are stored in advance, the first morpheme information extracted is compared with each fixed contents, and the fixed contents including the first morpheme information are selected from the fixed contents. It is characterized by acquiring.
[0008]
According to such an invention according to the present application, the conversation control device collates the first morpheme information constituting the input information input from the user with each pre-stored fixed content, and from among the fixed content , it is possible to find the standard content including a first morpheme information, the conversation control apparatus, for example, when the first morpheme information is showing a fixed contents "Hello", the routine contents of this standard contents identical " it is possible to say hello ".
[0009]
In addition, when the user input information has a fixed content, the conversation control device can answer the fixed content, so that the user first communicates with the conversation control device. You can feel as if you are.
[0010]
In the invention according to the present application, in the discourse range indicating the morpheme constituting the range related to the input information that will be input from the user or the response content to the user, a single character, a plurality of character strings, or A plurality of second morpheme information indicating morphemes composed of these combinations are associated with each other, each of the second morpheme information is associated with an answer content to the user, and a plurality of the discourse ranges are stored and extracted. The first morpheme information is compared with each discourse range, the discourse range including the first morpheme information is searched from each discourse range, and each second morpheme information associated with the searched discourse range; The extracted first morpheme information is collated, second morpheme information including the first morpheme information is searched from each second morpheme information, and the second morpheme information is based on the searched second morpheme information. Associated with It is characterized in obtaining the answer contents.
[0011]
According to the invention according to the present application, the conversation control device searches for the second morpheme information approximate to the first morpheme information, and each second morpheme information and the first morpheme information belonging to the “discourse range” And the second morpheme approximated to the first morpheme information is not required to be collated (it is possible to search by pinpoint), and it is not necessary to collate the “all” second morpheme information with the first morpheme information. The time required to search for information can be shortened.
[0012]
As a result, the conversation control device can search for the second morpheme information approximate to the first morpheme information in a short time, so that it is associated with the second morpheme information based on the searched second morpheme information. Can be obtained in a short time, and the input information from the user can be answered quickly.
[0013]
Further, the conversation control device searches the second morpheme information including the morpheme constituting the first morpheme information (the element constituting the user input information) from the second morpheme information. Since the response content associated with the second morpheme information can be acquired based on the information, the conversation control device is a semantic space constructed by each morpheme based on each morpheme constituting the user input information. In consideration of (subject, subject, etc.), it is possible to acquire the response content created in advance based on such semantic space, and simply acquire the response content associated with the keyword using the entire input information as a keyword. It is possible to acquire answer contents more suitable for input information.
[0014]
Furthermore, since the conversation control device searches for the second morpheme information including the first morpheme information, it is not necessary to search for the second morpheme information that completely matches the user's input information. The user does not need to store in advance a huge amount of response content corresponding to input information that will be input from the user, and the capacity of the storage unit can be reduced.
[0015]
In the invention according to the present application, a plurality of second morpheme information is associated with the discourse range, a plurality of response contents are associated with each second morpheme information, and each answer content has an answer type indicating the type of each answer content. The input type indicating the type of input information is identified based on the character string identified by the character recognition means, and the identified input type and the second are identified based on the retrieved second morpheme information. Match each answer type associated with the morpheme information, search for the answer type that matches the input type from each answer type, and based on the found answer type, the answer contents associated with the answer type It is characterized by acquiring. The input type or the answer type is preferably a positive, negative or repulsive type.
[0016]
According to the invention according to the present application, the conversation control device can select the user's answer from the answer types (description, affirmation, place, repulsion, etc.) associated with each second morpheme information belonging to the “discourse range”. Since the answer type corresponding to the input type is searched and the answer content associated with the answer type can be acquired based on the searched answer type, the conversation control device can input the information constituting the user's conversation content. Match the input type from multiple responses based on the type, for example, the user simply expressed his / her opinion, the user's impression, or the user described the location element It is possible to acquire the content of the answer, and it is possible to give a more optimal answer to the corresponding user.
[0017]
In addition, the conversation control device only searches for a response type that matches the user's input type from among the response types associated with each second morpheme information belonging only to the searched “discourse range” (pinpoint search). This eliminates the need to search through the response types associated with the “all” second morpheme information and the user's input type one by one, and obtains the optimum response content corresponding to the user's input type in a short time. can do.
[0018]
The invention according to the present application collates the extracted first morpheme information and each second morpheme information, and calculates the ratio of the first morpheme information to the second morpheme information for each second morpheme information, According to the size of each ratio calculated for each second morpheme information, one second morpheme information is selected from each second morpheme information, and based on the selected second morpheme information, The response content associated with the bimorphic information is acquired.
[0019]
According to the invention according to this application, the conversation control device calculates the ratio of the first morpheme information to the second morpheme information for each second morpheme information, and for each second morpheme information. Since one second morpheme information can be selected from each second morpheme information in accordance with the calculated size of each ratio, the conversation control device, for example, first morpheme information (user's If the second morpheme information in which the ratio of the elements constituting the input information) to the second morpheme information is large can be acquired from a plurality of second morpheme information groups, the semantic space constituted by the first morpheme information The followed second morpheme information can be acquired more accurately, and as a result, an optimal answer can be given to the user input information based on the second morpheme information.
[0020]
Moreover, since the conversation control device calculates the ratio of the first morpheme information to the second morpheme information for each second morpheme information belonging only to the searched “discourse range”, all the second morpheme information It is no longer necessary to calculate the proportion of the first morpheme information, and the second morpheme information that follows the semantic space composed of the first morpheme information can be acquired in a shorter time. Based on the second morpheme information, it is possible to quickly output the optimum answer content for the input information from the user.
[0021]
The invention according to the present application stores a plurality of pieces of element information indicating the entire set group including a plurality of morpheme sets in advance in association with the set group, collates the morpheme extracted from the character string with each set group, A set group including a morpheme is selected from each set group, and element information associated with the selected set group is extracted as first morpheme information.
[0022]
According to the invention according to the present application, the conversation control device collates the morpheme extracted from the character string with each set group, selects one set group including the morpheme from each set group, and selects Since the element information associated with the set group can be extracted as the first morpheme information, when the first morpheme information is, for example, “present”, “present” is, for example, present, gift, midsummer, celebration, etc. Therefore, the conversation control device can extract a representative element associated with the set group, for example, “gift” as the first morpheme information.
[0023]
Thereby, the developer who develops the conversation control device, for each similar first morpheme information, the second morpheme information corresponding to the semantic space grasped from the first morpheme information and the answer content related to the second morpheme information. There is no need to create each one, and as a result, the amount of data stored in the storage unit can be reduced.
[0024]
In the invention according to the present application, each morpheme constituting the second morpheme information is classified and stored in advance for each attribute such as a subject case consisting of a main case and a target case consisting of a target case. The morpheme is classified into each attribute such as subject case and target case, and each morpheme of the first morpheme information belonging to each classified attribute and each morpheme of each second morpheme information belonging to each attribute stored in advance The second morpheme information including the morpheme of the first morpheme information in at least one attribute is searched from the second morpheme information belonging to the “discourse range” by matching for each attribute.
[0025]
According to such an invention according to the present application, the conversation control device has each morpheme of the first morpheme information belonging to each classified attribute (subject case, target case, etc.) and each first attribute belonging to each attribute stored in advance. Since each morpheme of the dimorphic information is collated for each attribute, the second morpheme information including each morpheme of the first morpheme information in at least one attribute can be searched from each second morpheme information. The conversation control device has input information composed of things different from the normal word order, for example, when “person bites a dog”, the subject morpheme is “person” and the target case morpheme is “dog”. Therefore, it is possible to search for the second morpheme information that matches the morpheme belonging to each “case”, and the content of the response {“really?” Or “meaning” associated with the second morpheme information is well understood. Ca n’t get ”etc.” That.
[0026]
That is, since the conversation control device can identify input information that is difficult to identify, for example, “a person bites a dog” and “a dog bites a person”, the reply that is more suitable for the identified input information, the former For example, "Is it really?" For the latter, for example "Okay?" For the latter.
[0027]
Further, the conversation control device only needs to search for the second morpheme information including the morpheme of the first morpheme information in at least one attribute from the respective second morpheme information belonging to the “discourse range”. There is no need to acquire one second morpheme information from the morpheme information, and the second morpheme information that follows the semantic space composed of the first morpheme information can be acquired in a shorter time. Based on the acquired second morpheme information, it is possible to quickly output the optimum answer content for the input information from the user.
[0028]
Further, in the invention according to the present application, the first morpheme information is composed of each morpheme associated with each attribute such as a subject case consisting of a main case and a target case consisting of a target case, and is based on the extracted first morpheme information. The attribute that does not include the morpheme is searched from the attributes that constitute the first morpheme information, and the morpheme that constitutes the searched discourse range is added to the attribute based on the searched attribute. Each second morpheme information associated with the discourse range is compared with the first morpheme information to which the morpheme is added, and second morpheme information including the first morpheme information is obtained from each second morpheme information. It is characterized by searching.
[0029]
As described above, according to the invention according to the present application, the conversation control device has the first morpheme information even if the first morpheme information constituting the user input information is an abbreviated sentence and is not clear as Japanese. When belonging to a certain discourse range, the discourse range can be added to the first morpheme information, and the first morpheme information consisting of abbreviated sentences can be complemented.
[0030]
Therefore, the conversation control device identifies the first morpheme information so that the input information constituting the first morpheme information is in proper Japanese even if the input information constituting the first morpheme information is an abbreviated sentence. Since the morpheme can be complemented, the optimal second morpheme information related to the first morpheme information can be obtained from the second morpheme information based on the first morpheme information after the complement, Based on the acquired second morpheme information, it is possible to output answer contents more suitable for the user input information.
[0031]
As a result, even if the input information from the user is an abbreviated sentence, the conversation control device means what the abbreviated sentence means through past search results without using functions such as a neuronetwork and artificial intelligence. Since the developer of the conversation control device does not need to install a neuronetwork or artificial intelligence, the conversation control device system can be constructed more easily.
[0032]
Further, the invention according to the present application is based on the searched second morpheme information, the second morpheme information is compared with the searched discourse range, and the discourse range is selected from each morpheme constituting the second morpheme information. The morpheme corresponding to the morpheme is deleted, and based on the second morpheme information from which the morpheme has been deleted, another conversation range associated with the searched conversation range is acquired, and the morpheme constituting the acquired other conversation range is acquired. The response content associated with the second morpheme information is acquired based on the second morpheme information added to the second morpheme information and added with the morpheme.
[0033]
According to the invention according to this application, the conversation control device collates the second morpheme information with the searched discourse range based on the searched second morpheme information, and configures each of the second morpheme information. From the morpheme, the morpheme that matches the discourse range can be deleted, and the morpheme constituting another discourse range can be added to the second morpheme information based on the second morpheme information from which the morpheme has been deleted. Therefore, based on the second morpheme information to which the morpheme is added, an answer sentence associated with the second morpheme information can be acquired.
[0034]
As a result, the conversation control device does not directly output the answer sentence for the user input information, but the answer sentence related to the input information based on the second morpheme information including the newly added morpheme. Therefore, even if the answer contents for the user input information are not stored in advance, the answer contents related to the user input information can be acquired.
[0035]
Furthermore, when the second morpheme information including the first morpheme information cannot be searched from the second morpheme information, the invention according to the present application collates the first morpheme information with each answer content, When the answer contents including the first morpheme information can be searched from the answer contents, the second morpheme information associated with the searched answer contents is acquired.
[0036]
According to such an invention according to the present application, the conversation control device can search for the second morpheme information from the second morpheme information even if the second morpheme information matching the first morpheme information cannot be retrieved. An answer sentence including a morpheme (action or a morpheme associated with an action) constituting the first morpheme information can be identified from within, and the second morpheme information associated with the identified answer sentence can be searched. Therefore, the second morpheme information corresponding to the first morpheme information constituting the user input information can be appropriately searched.
[0037]
As a result, since the conversation control device can retrieve the optimum second morpheme information corresponding to the first morpheme information, the conversation control device can input the user input information based on the retrieved optimum second morpheme information. Appropriate answers can be obtained.
[0038]
The invention according to the present application is based on the meaning content of the standard content to be stored, such as the topic that the user wants, the user's emotional level for a certain matter, or the type of statement, affirmation, question, repulsion, etc. It is described in a language for hierarchically storing in a database in association with morphemes.
[0039]
Thereby, since the developer who develops the conversation control device can construct the second morpheme information and the like for searching the answer content for the input information of the user hierarchically using the language in the database, The conversation control device can acquire the response content for the input information from the database through a hierarchical procedure based on the user input information.
[0040]
That is, the conversation control device determines the hierarchy of user input information (for example, whether it is in a higher concept or a lower concept with respect to the second morpheme information stored in the database). Appropriate answer contents can be acquired from the answer contents accumulated in advance based on the above.
[0041]
For this reason, the conversation control device does not collate the first morpheme information made up of user input information with all the second morpheme information stored in advance, but each second morpheme belonging to a specific hierarchy. Since the information and the first morpheme information may be collated, the second morpheme information approximate to the first morpheme information can be acquired in a short time.
[0042]
Note that the stored fixed content, discourse range, second morpheme information, response content, response type, or set group may be described in the language. This language is preferably composed of DKML (Discourse Knowledge Markup Language).
[0043]
The invention according to the present application is such that each conversation control device is connected to a communication network, and one conversation control device has a fixed content, a discourse range, and a description range described in the language via the communication network with respect to another conversation control device. It is characterized by acquiring dimorphic information, answer content, answer type, or set group.
[0044]
In addition, a server that stores fixed content, discourse range, second morpheme information, response content, response type, set group, etc. described in the language is arranged on the communication network, and the conversation control device is connected via the communication network. The fixed content, the discourse range, the second morpheme information, the response content, the response type, or the set group described in the language may be acquired from the server.
[0045]
Thereby, the conversation control device, for example, when there is no answer content suitable for the user input information in the conversation control device, the answer content suitable for the user input information from another conversation control device through the communication network. (What is described in DKML or the like) or the like can be retrieved, and the retrieved response content or the like can be acquired.
[0046]
The invention according to the present application stores a history of acquired past answer contents, stores in advance agreement contents for agreeing to input information input from a user, and acquires the acquired first first morpheme information and the past If the current first morpheme information is included in the past answer contents, the contents of the agreement are acquired.
[0047]
According to the invention according to the present application, the conversation control device collates the current first morpheme information with the past answer content, and the current first morpheme information is included in the past answer content. In the conversation control device, since the input information currently input by the user matches the past answer contents, the user returns to the past answer contents (the user listens to the answer contents). It can be determined that the input information is input).
[0048]
In this case, the conversation control device obtains the stored agreement contents (for example, “That is right”) because the user is reversing the response contents in the past. Can be output. As a result, if the user does not understand the meaning of the answer contents output from the conversation control device, he / she can listen again and listen to the answer contents again, so that the user seems to have a conversation with another user. I can taste a sense.
[0049]
The invention according to the present application stores the acquired past first morpheme information, stores repulsion contents for repelling the user in advance, and acquires the acquired first first morpheme information and the past first morpheme. Information is collated, and when the current first morpheme information is included in the past first morpheme information, the repulsion content is acquired.
[0050]
According to the invention according to the present application, the conversation control device collates the current first morpheme information with the past first morpheme information, and the current first morpheme information is included in the past first morpheme information. In this case, since the content of repulsion can be acquired, the conversation control device is the same as the previous input information when the input information input last time is included in the input information input this time. It can be determined that the content of the input is repeatedly input, and it can be determined that the user has not appropriately answered the response content from the conversation control device.
[0051]
In this case, since the user does not appropriately answer the response content from the conversation control device, the conversation control device acquires and acquires the stored repulsion content to repel the user. Outputs the content of repulsion. As a result, if the user does not input appropriate input information for the response content from the conversation control device, the content of the repulsion is output from the conversation control device, so that the user seems to have a conversation with another user. I can taste a sense.
[0052]
The second morpheme information including the first morpheme information (including the discourse range, fixed content, answer content, etc., hereinafter abbreviated as “second morpheme information etc.”) It means not only the case where the information is included as it is, but also the case where the second morpheme information or the like includes at least one morpheme constituting the first morpheme information.
[0053]
DETAILED DESCRIPTION OF THE INVENTION
[Basic configuration of conversation control system]
A conversation control system according to the present invention will be described with reference to the drawings. FIG. 1 is a schematic configuration diagram of a conversation control system having a conversation control apparatus 1 according to the present embodiment.
[0054]
As shown in the figure, the conversation control device 1 includes an input unit 100, a speech recognition unit 200, a conversation control unit 300, a sentence analysis unit 400, a conversation database 500, an output unit 600, and a speech recognition dictionary storage. Part 700.
[0055]
In the present embodiment, for convenience of explanation, the description is limited to the user's utterance content (this utterance content is a kind of input information), but is not limited to the user's utterance content, and the keyboard. The input information may be input from the above. Therefore, the “utterance content” shown below can be described by replacing “utterance content” with “input information”.
[0056]
Similarly, in the following description, for convenience of explanation, the description will be limited to the “spoken sentence type” (speech type), but is not limited to this “spoken sentence type”, and input from a keyboard or the like. It may be an “input type” indicating the type of input information. Accordingly, the following “speech sentence type” (speech type) can be described by replacing “speech type” with “input type”.
[0057]
The input unit 100 is an acquisition unit that acquires input information from a user. In the present embodiment, a microphone, a keyboard, and the like are used. The input unit 100 is also a character recognition unit that specifies a character string indicating input information based on input information input from a user.
[0058]
Here, the input information means characters, symbols, voices and the like input through a keyboard or the like. Specifically, the input unit 100 acquires user input information (other than voice), and outputs the acquired input information to the conversation control unit 300. Further, the input unit 100 that has acquired the utterance content from the user (the utterance content is composed of voice and is a kind of input information) with a microphone or the like, the voice constituting the acquired utterance content is a voice signal. To the voice recognition unit 200.
[0059]
The voice recognition unit 200 is a character recognition unit that identifies a character string corresponding to the utterance content based on the utterance content acquired by the input unit 100. Specifically, the speech recognition unit 200 to which a speech signal is input from the input unit 100 analyzes the input speech signal, and a character string corresponding to the analyzed speech signal is stored in the speech recognition dictionary storage unit 700. The specified character string is output to the conversation control unit 300 as a character string signal. The speech recognition dictionary storage unit 700 stores a dictionary corresponding to standard speech signals.
[0060]
The sentence analysis unit 400 analyzes a character string specified by the input unit 100 or the speech recognition unit 200. In the present embodiment, as shown in FIG. 2, a morpheme extraction unit 410 and a phrase analysis unit 420 are included. A sentence structure analysis unit 430, an utterance type determination unit 440, a morpheme database 450, and an utterance type database 460.
[0061]
The morpheme extraction unit 410 is a morpheme extraction unit that extracts each morpheme constituting a minimum unit of a character string as first morpheme information based on the character string specified by the input unit 100 or the speech recognition unit 200.
[0062]
Specifically, the morpheme extraction unit 410 to which the character string signal is input from the management unit 310 extracts each morpheme from the character string corresponding to the input character string signal. Here, in this embodiment, the morpheme means the minimum unit of the word structure represented in the character string. As the minimum unit of the word structure, as shown in FIG. 3, for example, parts of speech such as nouns, adjectives and verbs can be cited. In the present embodiment, each morpheme is expressed as m1, m2,.
[0063]
That is, the morpheme extraction unit 410 collates a character string corresponding to the input character string signal with a morpheme group such as nouns, adjectives, and verbs stored in advance in the morpheme database 450, and the morpheme is extracted from the character string. Each morpheme (m1, m2,...) That matches the group is extracted, and each extracted morpheme is output to the phrase analysis unit 420 as an extraction signal.
[0064]
The phrase analysis unit 420 is a conversion unit that converts each morpheme into a phrase format based on each morpheme extracted by the morpheme extraction unit 410. Specifically, the phrase analysis unit 420 to which the extraction signal is input from the morpheme extraction unit 410 uses the morphemes corresponding to the input extraction signal to combine them into a phrase format.
[0065]
Here, in this embodiment, the phrase format is a sentence in which the independent grammar or one or more attached words are attached to the independent grammar in the Japanese grammar, or a character string that does not destroy the meaning of the Japanese grammar. Means a sentence that is separated as finely as possible. This clause is expressed as p1, p2,... Pk in this embodiment.
[0066]
That is, the phrase analysis unit 420, as shown in FIG. 4, based on each morpheme corresponding to the input extracted signal, the dependency element of each morpheme (for example, (m2), (m4), (m5) ) ・ ・) Is extracted, and each morpheme is grouped into each phrase based on the extracted dependency elements. “T” shown in the figure means transposition.
[0067]
The phrase analysis unit 420 that collects each morpheme into each phrase includes a sentence structure analysis unit 430 and an utterance type determination unit 440 using sentence pattern information including each phrase that combines each morpheme and each morpheme constituting each phrase as a sentence pattern signal. Output to.
[0068]
The sentence structure analysis unit 430 is a classification unit that classifies each morpheme of the first morpheme information segmented by the phrase analysis unit 420 into attributes such as subject case and target case. Specifically, the sentence structure analysis unit 430, to which the sentence pattern signal is input from the phrase analysis unit 420, determines each morpheme included in the phrase based on each morpheme corresponding to the input sentence pattern signal and the phrase composed of each morpheme. Determine the “case composition”.
[0069]
Here, the “case structure” means a case (attribute) indicating a substantial concept in the clause. In the present embodiment, for example, a subject (subject) that represents a subject / subject, Examples include a meaning object (target case), an action meaning an action, a time meaning (tense, aspect), a location meaning a place, and the like. In this embodiment, each morpheme associated with the “case” (case configuration) of the three elements of the subject, the object, and the action is used as the first morpheme information.
[0070]
That is, as shown in FIG. 5, for example, when the dependency element of each morpheme is “” or “is”, the sentence structure analysis unit 430 applies the subject (subject) to the morpheme before the dependency element. Or a leading character). In addition, the sentence structure analysis unit 430
For example, if the dependency element of each morpheme is “NO” or “NO”, it is determined that the morpheme before the dependency element is an object (target).
[0071]
Further, for example, when the dependency element of each morpheme is “Yes”, the sentence structure analysis unit 430 includes an action (predicate; this predicate is composed of a verb, an adjective, and the like). It is determined that
[0072]
The sentence structure analysis unit 430 that has determined the “case structure” of each morpheme that constitutes each clause determines the range of topics (topics) to be described later based on the first morpheme information associated with the determined “case structure”. A topic search command signal for specifying is output to the reflective determination unit 320.
[0073]
The utterance type determination unit 440 is a type specifying unit that specifies an utterance type (input type) indicating the type of utterance content (input information) based on the phrase specified by the phrase analysis unit 420. Specifically, “speech sentence type” (speech type) is determined based on each morpheme corresponding to the sentence pattern signal input from the phrase analysis unit 420 and a phrase composed of each morpheme.
[0074]
In this embodiment, as shown in FIG. 6, the “spoken sentence type” is a statement sentence (D; Declaration), an impression sentence (I; Impression), a conditional sentence (C; Condition), and a result sentence ( E; Effect, time sentence (T; Time), location sentence (L; Location), repulsive sentence (N; Negation), and the like.
[0075]
The statement sentence means a sentence composed of a user's opinion or idea, and in this embodiment, as shown in FIG. 6, for example, a sentence such as “I like Sato” can be cited. An impression sentence means the sentence which consists of an impression which a user holds. A place sentence means a sentence made up of place elements.
[0076]
A result sentence means a sentence composed of sentences including a result element for a topic. A time sentence means a sentence composed of sentences including temporal elements related to a topic.
[0077]
The conditional sentence means a sentence composed of sentences including elements such as a premise of a topic, a condition and a reason why the topic is established, when one utterance is regarded as a topic. The repulsive sentence means a sentence composed of a sentence including an element that repels the utterance partner. An example sentence for each “spoken sentence type” is as shown in FIG.
[0078]
That is, the utterance type determination unit 440 collates each phrase with each dictionary stored in the utterance type database 460 based on each phrase corresponding to the input sentence pattern signal, and from each phrase, Extract sentence elements related to the dictionary. The utterance type determination unit 440 that extracts sentence elements related to each dictionary from each phrase determines “spoken sentence type” based on the extracted sentence elements. The sentence element means a type for identifying the type of character string, and the sentence element in the present embodiment includes the above-described definition phrase (which means “-”).
[0079]
Here, as shown in FIG. 7, the utterance type database 460 includes a definition expression example dictionary having a dictionary related to a definition phrase (for example,), an affirmative phrase (for example, approval, sympathy, ping pong). positive cases dictionary with a dictionary related to, a result clause (for example, so, so) the results representation case dictionary with a dictionary related to, greeting clause (for example, Hello) greeting case dictionary with a dictionary related to, It is composed of a negative example dictionary having a dictionary related to a negative phrase (for example, it is not idiot, the opposite), and each dictionary is associated with “type of spoken sentence”.
[0080]
As a result, the utterance type determination unit 440 compares the phrase with each dictionary stored in the utterance type database 460, extracts the sentence element related to each dictionary from the phrase, and associates it with the extracted sentence element. The “spoken sentence type” can be determined by referring to the determined type.
[0081]
The utterance type determination unit 440 outputs an answer search command signal for causing the corresponding user to search for a specific answer sentence to the answer sentence search unit 370 based on an instruction from the topic search unit 360 described later.
[0082]
The conversation database 500 stores in advance a plurality of second morpheme information indicating each morpheme composed of one character, a plurality of character strings, or a combination thereof, and a plurality of reply contents to the user with respect to the utterance contents. Storage means (discourse storage means). The conversation database 500 is also an answer storage unit (discourse storage unit) that stores in advance a plurality of answer types indicating the types of answer contents associated with a plurality of answer contents in association with the second morpheme information.
[0083]
Furthermore, the conversation database 500 stores in advance a plurality of discourse ranges (keywords) indicating morphemes that constitute a range relevant to the input content that will be input by the user or the response content to the user. But there is. A plurality of second morpheme information indicating a morpheme made up of one character, a plurality of character strings, or a combination thereof is associated with the discourse range (keyword), and each second morpheme information includes a response content to the user. Associated with each.
[0084]
Furthermore, the conversation database 500 is also an answer storage means (discourse storage means) for classifying and storing each element constituting the second morpheme information into attributes such as each subject consisting of a main case and a target case consisting of a target case. .
[0085]
As shown in FIG. 8, in the present embodiment, the conversation database 500 is roughly divided in the present embodiment, which means a range that is related to the content of the speech that will be spoken by the user or the content of the response to the user. It consists of a range (discourse) and a topic (topic) that means a range that is most closely related to the content the user is speaking. As shown in the figure, “discourse range” is positioned as a superordinate concept of “topic” in the present embodiment.
[0086]
Each discourse range can be configured to have a hierarchical structure as shown in FIG. As shown in the figure, for example, a higher level discourse range (entertainment) for a certain discourse range (movie) is positioned in the upper hierarchical structure, and a lower level discourse range (movie) for the discourse range (movie). The attribute (movie) can be located in the lower hierarchical structure. That is, in the present embodiment, each discourse range can be arranged at a hierarchical position where the relationship between the higher concept, the lower concept, the synonym, and the synonym becomes clear with other discourse ranges.
[0087]
As described above, the discourse range is composed of topics, and in this embodiment, for example, if the discourse range is an A movie name, it includes a plurality of topics related to the A movie name.
[0088]
This topic means a morpheme composed of a single character, a plurality of character strings, or a combination thereof, that is, each morpheme constituting speech content that will be uttered by the user. Each morpheme is associated with a subject (subject), an object (target case), and an action “case” (attribute). In this embodiment, each morpheme associated with these three elements is expressed as a topic title (this topic title corresponds to a subordinate concept of “topic”) (second morpheme information). .
[0089]
The topic title is not limited to each morpheme associated with the above three elements, but other “cases”, that is, time (tense, aspect) meaning time, location meaning place, You may have each morpheme matched with the condition which means a condition, the impression which means an impression, the effect which means a result, etc.
[0090]
In this embodiment, the topic title (second morpheme information) is stored in advance in the conversation database 500, and the first morpheme information (derived from the utterance content uttered by the user) is It is a distinction.
[0091]
For example, if the talk range is “A movie name”, as shown in FIG. 10, the subject title is subject (A movie name), object (director), action (great) {this is “A movie name” The director of the name is composed of "meaning great".
[0092]
If there is no morpheme associated with “case composition” (subject, object, action, etc.) among the topic titles, “*” is indicated for the portion in the present embodiment.
[0093]
For example, {A What is a movie name? } Is converted into a topic title (subject; object; action). }, “A movie name” can be specified as a subject, but “object” and “action” are not elements of the sentence, so the topic title is “subject” (A movie name). “No object” (*); “No action” (*) (see FIG. 10).
[0094]
The answer sentence means an answer sentence (answer contents) to be answered to the user, and is associated with each topic title (second morpheme information) in this embodiment (see FIG. 8). In this embodiment, as shown in FIG. 11, the answer sentence is a statement sentence (D; Declaration), an impression sentence in order to make an answer corresponding to the type of utterance sentence uttered by the user. Types such as (I; Impression), conditional statement (C; Condition), result statement (E; Effect), time statement (T; Time), location statement (L; Location), negative statement (N; Negation) Type).
[0095]
That is, as shown in FIG. 12, each answer sentence is associated with, for example, a discourse range (Sato) {subordinate concept; home run, superordinate concept; grass baseball, synonym; panda Sato, Sato player, panda} and each topic title. It has been.
[0096]
As shown in the figure, for example, the topic title 1-1 is {(Sato; *; I like): this consists of the order of (subject; object; action) as described above. If the order is the same below, the answer sentence 1-1 corresponding to the topic title 1-1 is (DA; statement affirmation “I like Sato”), (IA; comment affirmation) “I like Sato very much”), (CA; conditional affirmation “Sato ’s home run is very impressive”), (EA; a result affirming “I always watch Sato's games on TV”), (TA: Time affirmative sentence "I actually like it from the five-bats continual refrain in Koshien"), (LA; Place affirmative sentence "I like the serious face when standing on the blow"), (NA A repulsive affirmative sentence "I don't want to talk to people who don't like Sato, goodbye").
[0097]
In the present embodiment, as shown in FIG. 2, the conversation control unit 300 includes a management unit 310, a reflexive determination unit 320, a turnback determination unit 330, a discourse range determination unit 340, and an abbreviated sentence complement unit 350. , A topic search unit 360 and an answer sentence search unit 370.
[0098]
The management unit 310 controls the entire conversation control unit 300. Specifically, the management unit 310 to which a character string is input from the input unit 100 or the voice recognition unit 200 outputs the input character string to the morpheme extraction unit 410 as a character string signal. In addition, the management unit 310 outputs the answer sentence searched by the answer sentence search unit 370 to the output unit 600.
[0099]
The reflexive determination unit 320 is a fixed form acquisition unit that collates the first morpheme information extracted by the morpheme extraction unit 410 with each fixed content, and searches the fixed content including the first morpheme information from each fixed content. .
[0100]
Here, the standard content means reflection element information for replying a standard content to the utterance content from the user, and this reflection element information is stored in the reflection element database 801 (standard storage means) in advance. A plurality are stored. As the reflective element information, in the present embodiment, as shown in FIG. 13, for example, "Good morning", "Hello", "Good evening", "greeting elements" such as "Hey", "I see", "Really?""Typicalelements" such as
[0101]
Specifically, the reflexive determination unit 320 to which the topic search command signal is input from the sentence structure analysis unit 430 receives the first morpheme information included in the input topic search command signal and the reflection element database 801. The reflection element information is collated, the reflection element information including the first morpheme information is searched from the reflection element information, and the searched reflection element information is output to the management unit 310.
[0102]
That is, assuming that the reflection element information is D1 and the first morpheme information is W, the reflective determination unit 320 determines that the relationship of W∩D1 ≠ φ (φ; empty set) is established. Process to give a typical answer.
[0103]
For example, when the user utters the utterance content “Good morning”, the reflexive determination unit 320 collates the utterance content “Good morning” with each reflection element information, and the utterance content from each reflection element information. The reflection element information “good morning” including (matching) “good morning” is searched, and the searched reflection element information “good morning” is output to the management unit 310.
[0104]
When the reflection determination unit 320 cannot search the reflection element information including the utterance content from the reflection element information, the reflex determination unit 320 returns the topic search command signal input from the sentence structure analysis unit 430. Output to.
[0105]
The return determination unit 330 collates the current first morpheme information extracted by the morpheme extraction unit 420 with the past answer contents stored in the return element database 802, and the current first morpheme information is the past answer. If included in the content, it is a fixed form acquisition means for acquiring the content of the agreement.
[0106]
Here, “turnback” means to say back the content of the user's utterance as it is (or content close to it) in this embodiment. In this embodiment, the return element is composed of the first morpheme information that constitutes the response content output from the conversation control device 1 immediately before. For example, as shown in FIG. (Horse; *; beautiful), “I like Sato” (Sato; *; I like).
[0107]
Further, the return element database 802 is also an agreement storage means for preliminarily storing agreement contents for agreeing to input information input by the user. The content of the agreement includes, for example, the input information previously input by the user (if the previous input information by the user is “A film name director is Mr. S”, the content of the agreement is “ The director of the A movie name is Mr. S)), or “Yes”, “It is true”.
[0108]
Specifically, the return determination unit 330 to which the topic search command signal is input from the reflective determination unit 320 configures the first morpheme information and the return element included in the input topic search command signal for each return element. Each morpheme is collated, and it is determined whether or not the first morpheme information is included in the return element (see FIG. 14).
[0109]
If it is determined that the first morpheme information is included in each return element, the return determination unit 330 acquires the content of the agreement and outputs an answer sentence including the acquired content of the agreement to the management unit 310 (return) Process). That is, assuming that the return element (such as the previous answer sentence) is S and the first morpheme information is W, the return determination unit 330 indicates the above when the relationship of W⊂S and W ≠ φ is established. Performs a reversal process.
[0110]
For example, the conversation control device 1 responds with “The director of the A movie name is Mr. S” (Director of the A movie name; Mr. S; *) (the order is the subject, the object, the order of the action, and so on. ) Is output, and then the user responds with a response if the utterance is “is the director of A movie name Mr. S” (director of A movie name; Mr. S; *)? Since the determination unit 330 matches the first morpheme information of the user (Director of A movie name; Mr. S; *) and each morpheme of the answer sentence (Director of A movie name; Mr. S; *), The user concludes that he / she is replying to the contents of the reply, obtains the stored agreement contents “Yes”, and outputs the obtained agreement contents.
[0111]
Further, the return determination unit 330 collates the current first morpheme information extracted by the morpheme extraction unit 410 with the past first morpheme information stored in the return element database 802 to obtain the current first morpheme information. Is included in the past first morpheme information, it is also a fixed form acquisition means for acquiring the repulsion content.
[0112]
Specifically, when the user utters the utterance content “Horse is beautiful” and the conversation control device 1 outputs the content “Horse is good” as the response content When the person repeats the utterance content that “the horse is beautiful”, the turn-back determination unit 330 determines that each morpheme (first morpheme information) {horse; *; beautiful} constituting the current utterance content “horse is beautiful” Each morpheme (first morpheme information) {horse; *; beautiful} that constitutes the content of the previous utterance “Horse is beautiful” matches the content of the response from the conversation control device 1 to the user. You can conclude that you have not heard at all about "I feel good."
[0113]
In this case, since the user has not heard the response content from the conversation control device 1, the return determination unit 330 acquires the stored repulsion content (for example, do not repeat the same content), and the acquired repulsion The contents can be output.
[0114]
On the other hand, if the reversion determining unit 330 determines that the first morpheme information is the same as the content of the previous answer sentence or the first morpheme information is not the same as the previous first morpheme information, the reflex determination unit 320 The input topic search command signal is output to the conversation range determination unit 340.
[0115]
In addition, although the said return determination part 330 has shown the process in case a user makes a return with respect to "the reply content of the conversation control apparatus 1," the following processes can also be performed. For example, when the output unit 600 outputs an answer sentence “Horse is beautiful”, the user answers “Why is the horse beautiful?”, “Why is it beautiful?”, Or “Why?” This is a process of the turn-back determination unit 330 performed when the utterance is made.
[0116]
In this case, the return determination unit 330 outputs the response sentence S “the horse is beautiful” and the utterance content W from the user (“Why is the horse beautiful? (Question sentence)” or “Why is it beautiful? (Question sentence) ”), (W−c) ⊂S, S ≠ φ, c ≠ φ (where c means the utterance type of W, and this utterance type is determined by the utterance type determination unit 440 described later. As will be described later, for example, a question sentence can be cited as an utterance type, so a “conditional” reversal processing (the user asks the question contents for the answer contents). (Processing when a flip is performed).
[0117]
For example, when the conversation control device 1 outputs an answer sentence “The horse is beautiful”, the above-mentioned user utters the content of the utterance “Why is the horse beautiful?”. At that time, in order to resolve the user's question, the return determination unit 330 acquires an answer sentence such as “Even the horse is not beautiful” from the return element database 802, and the acquired answer sentence is sent to the management unit 310. Process to output.
[0118]
The discourse range determination unit 340 is a discourse search unit that collates the first morpheme extracted by the phrase analysis unit 420 and each discourse range, and searches the discourse range including the first morpheme information from each discourse range. .
[0119]
Specifically, the conversation range determination unit 340 to which the topic search command signal is input from the turn-back determination unit 330 determines the user's conversation range based on the input talk search command signal. That is, based on the input search command signal, the conversation range determination unit 340 searches the conversation database 500 for a range (discourse range) relevant to the content spoken by the user.
[0120]
For example, the discourse range determination unit 340 includes the first morpheme information included in the input topic search command signal (an interesting movie; *; is there) {is there an interesting movie? }, The first morpheme information is compared with the discourse range group, and if the discourse range group includes a morpheme (for example, “movie”) constituting the first morpheme information, The “movie” included in the information is determined as the discourse range. In this case, since the discourse range “movie” is included in the first morpheme information, the discourse range determination unit 340 includes the input first morpheme information in the topic search command signal and outputs it to the topic search unit 360.
[0121]
On the other hand, when the first morpheme information does not include a discourse range group, the conversation range determination unit 340 includes the input first morpheme information in the topic search command signal and outputs it to the abbreviated sentence complement unit 350.
[0122]
Thereby, the topic search unit 360 described later collates each “topic title” belonging to the “discourse range” determined by the conversation range determination unit 340 with the first morpheme information specified by the sentence structure analysis unit 430. Therefore, it is unnecessary to collate “all” “topic titles” (second morpheme information) with the first morpheme information, and the answer sentence search unit 370 to be described later will search for the final answer sentence. Can be shortened.
[0123]
As described above, the discourse range determination unit 340 collates the first morpheme information and the discourse range group, and if the discourse range group includes the morpheme of the first morpheme information, determines the morpheme as the discourse range. However, the present invention is not limited to this, and the morpheme of the return element retrieved immediately by the return determination unit 330 or the morpheme constituting the utterance content uttered by the user may be determined as the discourse range. . The abbreviated sentence complementing unit 350, which will be described later, can add the discourse range to the first morpheme information from which the morpheme is omitted, using the discourse range determined by the discourse range determination unit 340.
[0124]
The abbreviated sentence complementing unit 350 searches the attributes (subjects, objects, actions, etc.) constituting the first morpheme information based on the first morpheme information extracted by the phrase analysis unit 420 for attributes that do not include a morpheme. Attribute search means. The abbreviated sentence complementing unit 350 is also a morpheme adding unit that adds a morpheme constituting the discourse range searched by the discourse range determining unit 340 to the attribute based on the searched attribute.
[0125]
Specifically, the abbreviated sentence complementing unit 350 to which the topic search command signal is input from the discourse range determination unit 340 is based on the first morpheme information included in the input discourse search command signal, and the utterance including the first morpheme information. It is determined whether or not the content is an abbreviated sentence. If the utterance content including the first morpheme information is an abbreviated sentence, the morpheme in the discourse range to which the first morpheme information belongs is added to the first morpheme information.
[0126]
For example, the abbreviation sentence complementing unit 350 has a morpheme constituting the first morpheme information included in the input topic search command signal (director; *; *) (director?) (This sentence is “what” director If it is unknown, it means an abbreviated sentence.), The discourse range determined by the discourse range determination unit 340 (A movie name; this A movie name indicates the title of the movie) If it is the first morpheme information belonging to A), the determined discourse range (A movie name) is added to the first morpheme information to the morpheme constituting the first morpheme information (director of “A movie name”; *; *) Yes.
[0127]
That is, assuming that the first morpheme information is W and the determined discourse range is D, the abbreviated sentence complementing unit 350 adds the discourse range D to W and includes the added first morpheme information in the topic search command signal. The information is output to the topic search unit 360.
[0128]
Thereby, even if the first morpheme information is an abbreviated sentence and it is not clear as Japanese, the abbreviated sentence complementing unit 350, when the first morpheme information belongs to a certain discourse range, for example, The discourse range D (A movie name) is added to the first morpheme information W (director; *; *), and the first morpheme information is added to W ′ (A movie name director; *; *). ? }, Even if the user's utterance content is an abbreviated sentence, the abbreviated sentence can be supplemented based on the previously determined discourse range, and the abbreviated sentence should be clarified Can do.
[0129]
For this reason, the first morpheme information is set so that the abbreviated sentence complementing unit 350 has the proper utterance contents constituting the first morpheme information even if the utterance contents constituting the first morpheme information are abbreviated sentences. Since the specific morpheme can be complemented, the topic search unit 360 acquires the optimal “topic title” (second morpheme information) related to the first morpheme information based on the first morpheme information after the complement. The answer sentence search unit 370 can output the answer content more suitable for the user's utterance content based on the “topic title” acquired by the topic search unit 360.
[0130]
The topic search unit 360 collates the first morpheme information extracted by the phrase analysis unit 420 or the first morpheme information supplemented by the abbreviated sentence complement unit 350 with each second morpheme information, It is the 1st search means which searches the 2nd morpheme information containing the morpheme which comprises 1st morpheme information from the inside.
[0131]
Specifically, the topic search unit 360 to which the topic search command signal is input from the talk range determination unit 340 or the abbreviated sentence complement unit 350 is based on the first morpheme information included in the input topic search command signal. The “topic title” including the morpheme of the first morpheme information is searched from each “topic title” (second morpheme information) belonging to the discourse range determined by the determination unit 340, and the search result is used as a search result signal. The information is output to the answer sentence search unit 370 and the utterance type determination unit 440.
[0132]
For example, when the “case configuration” constituting the first morpheme information is (Sato; *; I like) {I like Sato}, the topic search unit 360, as shown in FIG. Each morpheme (Sato; *; I like) belonging to the “composition” is compared with each topic title 1-1 to 1-4 belonging to the discourse range (Sato), and from among the topic titles 1-1 to 1-4 A topic title 1-1 (Sato; *; likes) that matches (or approximates) each morpheme (Sato; *; likes) belonging to the “case composition” is searched, and this search result is used as a search result signal as a response sentence. The data is output to the search unit 370 and the utterance type determination unit 440.
[0133]
The utterance type determination unit 440 to which the search result signal is input from the topic search unit 360, based on the input search result signal, an answer search command for searching for a specific answer sentence that answers to the corresponding user. A signal (this answer search command signal also includes the determined “sentence type”) is output to the answer sentence search unit 370.
[0134]
The answer sentence search unit 370 is an answer acquisition unit that acquires an answer sentence associated with the second morpheme information based on the second morpheme information (topic title) searched by the topic search unit 360. In addition, the answer sentence search unit 370 collates the utterance type of the identified user with each answer type associated with the second morpheme information based on the second morpheme information searched by the topic search unit 360, It is also a second search means for searching for an answer type that matches the user's utterance type from among the answer types.
[0135]
Specifically, the answer sentence search unit 370, to which the search result signal from the topic search unit 360 and the answer search command signal from the utterance type determination unit 440 are input, the topic title (search result) corresponding to the input search result signal. Based on the second morpheme information) and the “speech sentence type” (utterance type) corresponding to the answer search command signal, the answer sentence group (each answer content) associated with the “topic title”. Among them, an answer sentence having an answer type (this answer type means “type of answer sentence” shown in FIG. 11) that matches the “sentence sentence type” (DA, IA, CA, etc.) is searched.
[0136]
For example, when the topic title corresponding to the search result is the topic title 1-1 (Sato; *; I like) shown in FIG. 12, the answer sentence search unit 370 is associated with the topic title 1-1. Of the reply sentences 1-1 (DA, IA, CA, etc.), the reply composed of the reply type (DA) that matches the “spoken sentence type” (for example, DA; utterance type) determined by the utterance type determination unit 440. The sentence 1-1 (DA; (I also like Sato) is searched), and the searched answer sentence is output to the management unit 310 as an answer sentence signal.
[0137]
The management unit 310 to which the answer sentence signal is input from the answer sentence search unit 370 outputs the input answer sentence signal to the output unit 600. In addition, the management unit 310 to which the reflection element information is input from the reflective determination unit 320 or the contents of the turn-back process from the turn-back determination unit 330, the answer sentence corresponding to the input reflection element information, the content of the turn-back process that is input To the output unit 600.
[0138]
The output unit 600 is an output unit that outputs the answer text acquired by the answer text search unit 370. In this embodiment, for example, a speaker, a display, and the like can be given. Specifically, the output unit 600 to which an answer sentence is input from the management unit 310 outputs the input answer sentence {for example, I also like Sato}.
[0139]
[Conversation control method using conversation control device]
The conversation control method by the conversation control apparatus 1 having the above configuration can be implemented by the following procedure. FIG. 15 is a flowchart showing the procedure of the conversation control method according to the present embodiment.
[0140]
First, the input unit 100 performs a step of acquiring the utterance content from the user (S101). Specifically, the input unit 100 acquires the voice that constitutes the utterance content of the user, and outputs the acquired voice to the voice recognition unit 200 as a voice signal. Further, the input unit 100 identifies a character string corresponding to the input information (other than the voice) based on the input information (other than the voice) input from the user, and the conversation control unit uses the identified character string as a character string signal. Output to 300.
[0141]
Next, the voice recognition unit 200 performs a step of specifying a character string corresponding to the utterance content based on the utterance content acquired by the input unit 100 (S102). Specifically, the speech recognition unit 200 to which a speech signal is input from the input unit 100 analyzes the input speech signal, and a character string corresponding to the analyzed speech signal is stored in the speech recognition dictionary storage unit 700. The specified character string is output to the conversation control unit 300 as a character string signal.
[0142]
And the morpheme extraction part 410 performs the step which extracts each morpheme which comprises the minimum unit of a character string as 1st morpheme information based on the character string specified by the speech recognition part 200 (S103).
[0143]
Specifically, the morpheme extraction unit 410 to which the character string signal is input from the management unit 310 includes a character string corresponding to the input character string signal and nouns, adjectives, verbs, and the like stored in advance in the morpheme database 450. The morpheme group is collated, each morpheme (m1, m2,...) Matching the morpheme group is extracted from the character string, and each extracted morpheme is output to the phrase analysis unit 420 as an extraction signal.
[0144]
Then, the phrase analysis unit 420 performs a step of grouping each morpheme into a phrase format based on each morpheme extracted by the morpheme extraction unit 410 (S104). Specifically, the phrase analysis unit 420 to which the extraction signal is input from the morpheme extraction unit 410 uses the morphemes corresponding to the input extraction signal to combine them into a phrase format.
[0145]
That is, as shown in FIG. 4, the phrase analysis unit 420 extracts and extracts the dependency elements (for example, gahahahahaha ...) of each morpheme based on each morpheme corresponding to the input extraction signal. Each morpheme is grouped into each clause based on the dependency element.
[0146]
The phrase analysis unit 420 that collects each morpheme into each phrase includes a sentence structure analysis unit 430 and an utterance type determination unit 440 using sentence pattern information including each phrase that combines each morpheme and each morpheme constituting each phrase as a sentence pattern signal. Output to.
[0147]
Thereafter, the sentence structure analysis unit 430 performs a step of classifying each morpheme of the first morpheme information segmented by the phrase analysis unit 420 into attributes such as subject case and target case (S105). Specifically, the sentence structure analysis unit 430, to which the sentence pattern signal is input from the phrase analysis unit 420, determines each morpheme included in the phrase based on each morpheme corresponding to the input sentence pattern signal and the phrase composed of each morpheme. Determine the “case composition”.
[0148]
That is, as shown in FIG. 5, for example, when the dependency element of each morpheme is “” or “is”, the sentence structure analysis unit 430 applies the subject (subject) to the morpheme before the dependency element. Or a leading character). For example, when the dependency element of each morpheme is “NO” or “NO”, the sentence structure analysis unit 430 determines that the morpheme before the dependency element is an object (target).
[0149]
Further, for example, when the dependency element of each morpheme is “Yes”, the sentence structure analysis unit 430 includes an action (predicate; this predicate is composed of a verb, an adjective, and the like). It is determined that
[0150]
The sentence structure analysis unit 430 that has determined the “case structure” of each morpheme that constitutes each clause determines the range of topics (topics) to be described later based on the first morpheme information associated with the determined “case structure”. A topic search command signal for specifying is output to the topic search unit 360.
[0151]
Next, the utterance type determination unit 440 performs a step of specifying an utterance type indicating the type of utterance content based on the phrase specified by the phrase analysis unit 420 (S106). Specifically, “speech sentence type” (speech type) is determined based on each morpheme corresponding to the sentence pattern signal input from the phrase analysis unit 420 and a phrase composed of each morpheme.
[0152]
That is, the utterance type determination unit 440 collates each phrase with each dictionary stored in the utterance type database 460 based on each phrase corresponding to the input sentence pattern signal, and from each phrase, Extract sentence elements related to the dictionary. The utterance type determination unit 440 that extracts sentence elements related to each dictionary from each phrase determines “spoken sentence type” based on the extracted sentence elements.
[0153]
The utterance type determination unit 440 outputs an answer search command signal for causing the corresponding user to search for a specific answer sentence to the answer sentence search unit 370 based on an instruction from the topic search unit 360 described later.
[0154]
Next, the reflexive determination unit 320 compares the first morpheme information extracted by the morpheme extraction unit 410 with each fixed content, and performs a step of searching for fixed content including the first morpheme information from each fixed content. (S107: reflective processing).
[0155]
Specifically, the reflexive determination unit 320 to which the topic search command signal is input from the sentence structure analysis unit 430 receives the first morpheme information included in the input topic search command signal and the reflection element database 801. The reflection element information (standard content) is collated, the reflection element information including the first morpheme information is searched from each reflection element information, and the searched reflection element information is output to the management unit 310.
[0156]
When the reflection element information cannot be searched for the reflection element information including the first morpheme information from the reflection element information, the reflection determination unit 320 determines whether to return the topic search command signal input from the sentence structure analysis unit 430. To the unit 330.
[0157]
Next, the return determination unit 330 collates the first morpheme information extracted by the morpheme extraction unit 410 with each return element, and performs a step of searching for the return element including the first morpheme information from each return element ( S108;
[0158]
When it is determined that the first morpheme information is included in each return element, the return determination unit 330 acquires the return element including the first morpheme information, and manages the response sentence including the acquired return element. The data is output to the unit 310 (turnback processing). That is, if the return element (answer sentence output last time, utterance content spoken by the previous user, etc.) is S and the first morpheme information is W, the return determination unit 330 has a relationship of W⊂S and W ≠ φ. If it is established, the turn-back process shown above is performed.
[0159]
On the other hand, when determining that the first morpheme information is not included in each return element, the return determination unit 330 sends the topic search command signal input from the reflective determination unit 320 to the conversation range determination unit 340. Output.
[0160]
Then, the discourse range determination unit 340 collates the first morpheme extracted by the phrase analysis unit 420 with each discourse range, and searches (determines) the discourse range including the first morpheme information from each discourse range. A step is performed (S109).
[0161]
Specifically, the conversation range determination unit 340, to which the topic search command signal is input from the reversal determination unit 330, is based on the input search command signal, and the content the user is speaking from the conversation database 500. Search for a relevant range (discourse range).
[0162]
For example, the discourse range determination unit 340 includes the first morpheme information included in the input topic search command signal (an interesting movie; *; is there) {is there an interesting movie? }, The first morpheme information is compared with the discourse range group, and if the discourse range group includes a morpheme (for example, “movie”) constituting the first morpheme information, The “movie” included in the information is determined as the discourse range. In this case, since the discourse range “movie” is included in the first morpheme information, the discourse range determination unit 340 includes the input first morpheme information in the topic search command signal and outputs it to the topic search unit 360.
[0163]
On the other hand, when the first morpheme information does not include a discourse range group, the conversation range determination unit 340 includes the input first morpheme information in the topic search command signal and outputs it to the abbreviated sentence complement unit 350.
[0164]
Next, the abbreviation sentence complementing unit 350 includes attributes that do not include a morpheme among the attributes (subject, object, action, etc.) constituting the first morpheme information based on the first morpheme information extracted by the phrase analysis unit 420. Perform the step of searching. Thereafter, the abbreviated sentence complementing unit 350 performs a step of adding the morpheme constituting the discourse range searched by the discourse range determining unit 340 to the attribute based on the attribute not including the searched morpheme (S110; abbreviated sentence). Complement).
[0165]
Specifically, the abbreviated sentence complementing unit 350 to which the topic search command signal is input from the discourse range determination unit 340 is based on the first morpheme information included in the input discourse search command signal, and the utterance including the first morpheme information. It is determined whether or not the content is an abbreviated sentence. If the utterance content including the first morpheme information is an abbreviated sentence, the morpheme in the discourse range to which the first morpheme information belongs is added to the first morpheme information.
[0166]
For example, the abbreviation sentence complementing unit 350 has a morpheme constituting the first morpheme information included in the input topic search command signal (director; *; *) (director?) (This sentence is “what” director If it is unknown, it means an abbreviated sentence.), The conversation range previously determined by the conversation range determination unit 340 (A movie name; this A movie name is the title of the movie) The first morpheme information belonging to the first morpheme information is added to the first morpheme information ("A movie name"). Director; *; *).
[0167]
That is, assuming that the first morpheme information is W and the determined discourse range is D, the abbreviated sentence complementing unit 350 adds the discourse range D to the first morpheme information W, and uses the first morpheme information after the addition as a topic search command. It is included in the signal and output to the topic search unit 360.
[0168]
Next, the topic search unit 360 collates the first morpheme information extracted by the phrase analysis unit 420 or the first morpheme information supplemented by the abbreviated sentence complement unit 350 with each second morpheme information, and each second morpheme A step of searching for second morpheme information including morpheme constituting the first morpheme information from the information is performed (S111).
[0169]
Specifically, the topic search unit 360 to which the topic search command signal is input from the talk range determination unit 340 or the abbreviated sentence complement unit 350 is based on the first morpheme information included in the input topic search command signal. The “topic title” including the morpheme of the first morpheme information is searched from each “topic title” (second morpheme information) belonging to the discourse range determined by the determination unit 340, and the search result is used as a search result signal. The information is output to the answer sentence search unit 370 and the utterance type determination unit 440.
[0170]
For example, when the “case configuration” constituting the first morpheme information is (Sato; *; I like) {I like Sato}, the topic search unit 360, as shown in FIG. Each morpheme (Sato; *; I like) belonging to the “composition” is compared with each topic title 1-1 to 1-4 belonging to the discourse range (Sato), and from among the topic titles 1-1 to 1-4 A topic title 1-1 (Sato; *; likes) that matches (or approximates) each morpheme (Sato; *; likes) belonging to the “case composition” is searched, and this search result is used as a search result signal as a response sentence. The data is output to the search unit 370 and the utterance type determination unit 440.
[0171]
The utterance type determination unit 440 to which the search result signal is input from the topic search unit 360, based on the input search result signal, an answer search command for searching for a specific answer sentence that answers to the corresponding user. A signal (this answer search command signal also includes the determined “sentence type”) is output to the answer sentence search unit 370.
[0172]
Then, the answer sentence search unit 370 collates the utterance type of the identified user with each answer type associated with the second morpheme information based on the second morpheme information searched by the topic search unit 360, A search is made for a response type that matches the user's utterance type from each response type, and an answer sentence associated with the response type is obtained based on the searched response type (S112).
[0173]
Specifically, the answer sentence search unit 370, to which the search result signal from the topic search unit 360 and the answer search command signal from the utterance type determination unit 440 are input, the topic title (search result) corresponding to the input search result signal. Based on the second morpheme information) and the “speech sentence type” (utterance type) corresponding to the answer search command signal, the answer sentence group (each answer content) associated with the “topic title”. Among them, an answer sentence having an answer type (this answer type means “type of answer sentence” shown in FIG. 11) that matches the “sentence sentence type” (DA, IA, CA, etc.) is searched.
[0174]
For example, when the topic title corresponding to the search result is the topic title 1-1 (Sato; *; I like) shown in FIG. 12, the answer sentence search unit 370 is associated with the topic title 1-1. Of the reply sentences 1-1 (DA, IA, CA, etc.), the reply composed of the reply type (DA) that matches the “spoken sentence type” (for example, DA; utterance type) determined by the utterance type determination unit 440. The sentence 1-1 (DA; (I also like Sato) is searched), and the searched answer sentence is output to the management unit 310 as an answer sentence signal.
[0175]
Next, the management unit 310 to which the answer sentence signal is input from the answer sentence search unit 370 outputs the input answer sentence signal to the output unit 600. In addition, the management unit 310 to which the reflection element information is input from the reflective determination unit 320 or the contents of the turn-back process from the turn-back determination unit 330, the answer sentence corresponding to the input reflection element information, the content of the turn-back process that is input Is output to the output unit 600 (S113). The output unit 600 to which an answer sentence is input from the management unit 310 outputs the input answer sentence {for example, I also like Sato}.
[0176]
[Operations and effects of conversation control device and conversation control method]
According to the invention according to the present application having the above-described configuration, the reflexive determination unit 320 collates the first morpheme information constituting the utterance content uttered by the user with each fixed content stored in advance, and each fixed content from among, it is possible to find the standard content including a first morpheme information, reflexive determination unit 320, for example when the first morpheme information is a fixed content such as "Hello" includes the standard content it is possible to answer the same boilerplate content "Hello" or the like.
[0177]
In addition, when the user's utterance content is a fixed content, the reflexive determination unit 320 replies with the fixed content (greeting etc.), so that the user first contacts the conversation control device 1. You can enjoy a sense of communication.
[0178]
Further, the reversal determination unit 330 compares the current first morpheme information with the past response content, and if the current first morpheme information is not included in the past response content, the agreement stored in advance is stored. Since the contents can be acquired, if the input information currently input from the user matches the past response contents, the return determination unit 330 returns the user to the previous response contents (use It is possible to conclude that the user has input the input information that the person is listening to the response content.
[0179]
In this case, the return determination unit 330 acquires the contents of the agreement that has been stored and the acquired agreement (for example, “That ’s right”) because the user has made a response to the previous response. Can be output. As a result, if the user does not understand the meaning of the answer content output from the conversation control device 1, he can listen again and listen again to the answer content, so he is also talking to other users. You can taste a feeling like this.
[0180]
Further, the reversal determination unit 330 collates the current first morpheme information with the past first morpheme information, and if the current first morpheme information is included in the past first morpheme information, the repulsion content is acquired. Therefore, when the input information input last time is included in the input information input this time, the user may repeatedly input the same content as the previous input information. Therefore, it can be determined that the user has not properly answered the response content from the conversation control device.
[0181]
In this case, since the user does not appropriately reply to the previous response content, the reversal determination unit 330 repels the user, so the stored repulsion content is acquired, and the acquired repulsion content Is output. As a result, if the user does not input appropriate input information with respect to the response content from the conversation control device 1, the repulsion content is output from the conversation control device 1. You can taste a sense of being.
[0182]
Further, in order to search for the second morpheme information approximate to the first morpheme information, the topic search unit 360 may collate each second morpheme information belonging to the “discourse range” with the first morpheme information. Since it is not necessary to collate the second morpheme information with the first morpheme information, the time until the second morpheme information approximate to the first morpheme information can be shortened.
[0183]
As a result, the topic search unit 360 can search (pinpoint search) the second morpheme information that approximates the first morpheme information in a short time, so that the answer sentence search unit 370 is the topic search unit 360. An answer sentence associated with the second morpheme information can be acquired in a short time based on the searched second morpheme information, and the conversation control device 1 quickly answers the utterance content from the user. be able to.
[0184]
Moreover, the topic search part 360 searches the 2nd morpheme information which contains the morpheme (element which comprises a user's utterance content) which comprises 1st morpheme information from each 2nd morpheme information, and an answer sentence search part Since 370 can acquire the answer content associated with the second morpheme information based on the second morpheme information searched by the topic search unit 360, the answer sentence search unit 370 can obtain the utterance content of the user. Based on each constituent morpheme (first morpheme information), it is possible to take into account the semantic spaces (subjects, objects, etc.) constructed by each morpheme and obtain the response contents created in advance based on such semantic spaces Thus, it is possible to acquire the answer content more suitable for the utterance content, rather than simply using the entire utterance content as a keyword and obtaining the answer content associated with the keyword.
[0185]
Further, since the topic search unit 360 searches for the second morpheme information including the first morpheme information, it is not necessary to search for the second morpheme information that completely matches the utterance content of the user, and the conversation control device 1 is developed. The developer who does not need to memorize a huge amount of answer contents corresponding to the utterance contents that will be uttered by the user in advance, and can reduce the capacity of the storage unit.
[0186]
Furthermore, the answer sentence search unit 370 selects the answer type that matches the user's utterance type from the answer types (description, affirmation, location, repulsion, etc.) associated with each second morpheme information belonging to the “discourse range”. Since the response content associated with the response type can be acquired based on the searched response type, the conversation control device 1 can determine the utterance type that constitutes the user's conversation content, for example, the user Answers that match the user's utterance type out of multiple answers based on what is simply stated, what the user has to say, what the user describes the location element, etc. As a result, it is possible to obtain an optimal answer to the corresponding user.
[0187]
Furthermore, the answer sentence search unit 370 matches the user's utterance type from the answer types associated with the second morpheme information belonging only to the “discourse range” searched by the discourse range determination unit 340. Since it is only necessary to search for the type (pinpoint search is possible), it is not necessary to search for the response type associated with the “all” second morpheme information and the user's utterance type one by one. Can be obtained in a short time.
[0188]
Finally, the abbreviated sentence complementing unit 350 belongs to the discourse range in which the first morpheme information exists even if the first morpheme information constituting the utterance content of the user is an abbreviated sentence and is not clear as Japanese. If so, the discourse range can be added to the first morpheme information, and the first morpheme information consisting of abbreviated sentences can be complemented.
[0189]
Thus, the abbreviated sentence complementing unit 350 allows the first morpheme information so that the utterance contents constituting the first morpheme information are appropriate Japanese even if the utterance contents constituting the first morpheme information are abbreviated sentences. Since a specific morpheme (such as a morpheme constituting a discourse range) can be complemented, the topic search unit 360 is based on the first morpheme information after completion supplemented by the abbreviated sentence complement unit 350. The optimal second morpheme information related to the information can be acquired, and the answer sentence search unit 370 can select the answer content more suitable for the user's utterance content based on the second morpheme information acquired by the topic search unit 360. Can be output.
[0190]
As a result, even if the input information from the user is an abbreviated sentence, the conversation control device 1 does not use a function such as a neuro network or an AI intelligence, and does not mean what the abbreviated sentence means through past search results. Since the developer of the conversation control device 1 does not need to install a neuro network or AI intelligence, the system of the conversation control device 1 can be constructed more simply.
[0191]
[Example of change]
In addition, this invention is not limited to the said embodiment, The change as shown below can be added.
[0192]
(First change example)
In this modification, the conversation database 500 may be an element storage unit that stores a plurality of pieces of element information indicating the entire set group including a plurality of morpheme sets in association with the set group. Further, the morpheme extraction unit 410 collates the morpheme extracted from the character string with each set group, selects a set group including the extracted morpheme from each set group, and selects an element associated with the selected set group. Information may be extracted as first morpheme information.
[0193]
As shown in FIG. 16, some morphemes included in the character string uttered by the user are similar. For example, as shown in FIG. 16, if the element information indicating the entire group is “gift”, the “gift” is similar to a present, gift, year-end gift, mid-year gift, celebration, etc. (group). Therefore, when there is a morpheme similar to “gift” (such as the present), the morpheme extraction unit 410 can handle the similar morpheme as “gift”.
[0194]
That is, for example, when the morpheme extracted from the character string is “present”, the morpheme extraction unit 410 has “present” as the element information representing “present” as shown in FIG. “Present” can be replaced with “Gift”.
[0195]
This allows the morpheme extraction unit 410 to sort out morphemes that are similar to each other, so that the developer who develops the conversation control device can perform the first corresponding to the semantic space that is grasped from the mutually similar first morpheme information. It is not necessary to create reply contents related to the bimorphic information and the second morpheme information one by one, and as a result, the amount of data stored in the storage unit can be reduced.
[0196]
(Second modified example)
As shown in FIG. 17, in the present modification example, the topic search unit 360 may include a ratio calculation unit 361 and a selection unit 362.
[0197]
The ratio calculation unit 361 compares the first morpheme information extracted by the morpheme extraction unit 410 with each second information, and the ratio of the first morpheme information to the second morpheme information for each second morpheme information. Is a calculation means for calculating.
[0198]
Specifically, the ratio calculation unit 361 to which the topic search command signal is input from the sentence structure analysis unit 430, based on the first morpheme information included in the input topic search command signal, as shown in FIG. One morpheme information is collated with each topic title (second morpheme information) belonging to the discourse range stored in the conversation database 500, and the first morpheme information occupies in each topic title for each topic title. Calculate the percentage.
[0199]
For example, as shown in FIG. 18, when the first morpheme information constituting the utterance sentence uttered by the user is (Sato; *; I like) {I like Sato}, the ratio calculation unit 361 Each morpheme belonging to “case composition” is matched with each morpheme belonging to “case composition” by comparing each morpheme belonging to “case composition” (Sato; *; likes) and each morpheme included in the topic title (Sato; *; likes). The ratio of (Sato; *; I like) is calculated to be 100%. The ratio calculation unit 361 performs these calculations for each topic title, and outputs each calculated ratio to the selection unit 362 as a ratio signal.
[0200]
The selection unit 362 is a selection unit that selects one second morpheme information from each second morpheme information according to the size of each rate calculated by the rate calculation unit 361 for each second morpheme information. is there.
[0201]
Specifically, the selection unit 362 to which the ratio signal is input from the ratio calculation unit 361 selects from among the ratios included in the input ratio signal (element of “case configuration” / element of “topic title” × 100). For example, a topic title with a high ratio is selected (see FIG. 18). The selection unit 362 that has selected a topic title with a high ratio outputs the selected topic title to the answer sentence search unit 370 and the utterance type determination unit 440 as a search result signal. The answer sentence search unit 370 acquires an answer sentence associated with the topic title based on the topic title selected by the selection unit 362.
[0202]
Accordingly, the selection unit 362 calculates the ratio of the first morpheme information to the second morpheme information for each second morpheme information, and the size of each ratio calculated for each second morpheme information. Accordingly, one second morpheme information can be selected from each second morpheme information, so that the selection unit 362 has, for example, first morpheme information (which constitutes the user's utterance content). If second morpheme information with a large proportion of second morpheme information can be acquired from a plurality of second morpheme information groups, the second morpheme information that follows the semantic space grasped from the first morpheme information is more As a result, the answer sentence search unit 370 can make an optimum answer to the utterance content of the user.
[0203]
Further, since the selection unit 362 can select a topic title having a high ratio calculated by the ratio calculation unit 361 from a plurality of topic titles, the selection unit 362 belongs to the “case configuration” included in the user's utterance sentence. Even if each morpheme and each topic title stored in the conversation database 500 do not completely match, it is possible to acquire a topic title closely related to each morpheme belonging to “case composition”.
[0204]
As a result, since the selection unit 362 can acquire a topic title closely related to the “case configuration” constituting the first morpheme information, the developer who develops the conversation control device 1 configures the first morpheme information. Since it is not necessary to store topic titles that completely match “case configuration” in the conversation database 500, the capacity of the conversation database 500 can be reduced.
[0205]
Further, the ratio calculation unit 361 calculates the ratio of the first morpheme information to the second morpheme information for each second morpheme information belonging only to the “discourse range” searched by the discourse range determination unit 340. Therefore, it is not necessary to calculate the ratio of the first morpheme information to the “all” second morpheme information, and the second morpheme information that follows the semantic space composed of the first morpheme information is acquired in a shorter time. As a result, it is possible to quickly output the optimum answer contents for the utterance contents from the user based on the acquired second morpheme information.
[0206]
The ratio calculation unit 361 collates each morpheme of the first morpheme information belonging to each classified attribute and each morpheme of each second morpheme information belonging to each attribute stored in advance for each attribute. It may be a first search means for searching for second morpheme information including each morpheme of the first morpheme information in at least one attribute from the second morpheme information.
[0207]
Specifically, the ratio calculation unit 361 to which the topic search command signal is input, for each “case” (subject; object; action) of the “case configuration” included in the input topic search command signal. ”And each morpheme belonging to“ case ”of the topic title composed of the same“ case ”are collated, and it is determined whether or not the morphemes constituting each“ case ”are the same.
[0208]
For example, as illustrated in FIG. 19, when the “case” morpheme of “case configuration” is (dog; person; bitten) {dog bites a person}, the ratio calculation unit 361 displays those morphemes. Match "dog", "person", and "chewed" with the morpheme "dog", "person", and "chewed" of the topic title consisting of the same "case" that constitutes the morpheme Then, among the morphemes “dog”, “people”, and “chewing” that make up the topic title, the “case composition” morpheme “dog” consisting of the same “case” corresponding to each morpheme, The ratio of “people” and “biting” is calculated (100%).
[0209]
If the element constituting the topic title is (person; dog; bite) {person bites the dog}, the ratio calculation unit 361 performs morphemes belonging to two cases by the same procedure as described above. Therefore, the degree of coincidence of each “case” between the morpheme constituting “case composition” and “topic title” is calculated to be 33% (see FIG. 19).
[0210]
The ratio calculation unit 361 that has calculated the ratio selects a topic title with a high ratio from the ratios, and outputs the selected topic title to the answer sentence search unit 370 and the utterance type determination unit 440 as a search result signal.
[0211]
As a result, the ratio calculation unit 361 displays, for each “case”, each morpheme of the first morpheme information belonging to each classified “case configuration” (subject case, target case, etc.) and a pre-stored topic title. Since the second morpheme information including each morpheme of the first morpheme information in at least one “case” can be searched from each topic title, the ratio calculator 361 is different from the normal word order. If the utterance content is composed of things, for example, “a person bites a dog”, the morpheme of the subject case is “person” and the morpheme of the subject case is “dog”. You can search for matching second morpheme information, and obtain the response contents {"really?" Or "I don't know the meaning"} associated with the second morpheme information (person; dog; bite) can do.
[0212]
That is, since the ratio calculation unit 361 can identify utterance contents that are difficult to identify, for example, “a person bites a dog” and “a dog bites a person”, an optimal answer to the identified utterance contents, For the former, for example, “Really?”, For the latter, for example, “Are you okay?”
[0213]
Further, the ratio calculation unit 361 may search for the second morpheme information including the morpheme of the first morpheme information in at least one attribute from the respective second morpheme information belonging to the “discourse range”. From the second morpheme information, it is no longer necessary to acquire one second morpheme information, the second morpheme information that follows the semantic space composed of the first morpheme information can be acquired in a shorter time, As a result, the conversation control device 1 can quickly output the optimum answer content for the utterance content from the user based on the acquired second morpheme information.
[0214]
Note that the selection unit 362 may select one topic title from among the topic titles according to a predetermined priority order. This priority order means a priority for selection as a topic title. This priority order is predetermined by the developer at the development stage.
[0215]
(Third change example)
As shown in FIG. 20, the present modification is not limited to the above-described embodiment and each modification, and data is transmitted and received via the communication network 800 in the conversation control devices 1 a and 1 b and the communication network 1000. Communication unit 900, conversation databases 500b to 500d connected to communication unit 900, and servers 2a to 2c (conversation control system).
[0216]
Here, the communication network 1000 means a communication network that transmits and receives data. In the present embodiment, for example, the Internet is used. In this modification, the conversation databases 500b to 500d and the servers 2a to 2c are limited for convenience. However, the present invention is not limited to this, and other conversation databases may be provided.
[0217]
Thereby, the conversation control unit 300 refers not only to the conversation database 500a arranged inside the conversation control apparatus 1a but also to other conversation control apparatuses 1b, other conversation databases 500b to 500d, and servers 2a to 2c. Therefore, for example, it is a case where it is not possible to search from the conversation database 500a the discourse range related to each morpheme (first morpheme information) belonging to the “case configuration” included in the topic search command signal. However, by referring to the other conversation control device 1b, conversation databases 500b to 500d, and servers 2a to 2c, it is possible to search the range of conversation related to the above “case structure” and the like based on the user's utterance sentence. A suitable answer sentence can be searched.
[0218]
(Fourth change example)
The sentence structure analysis unit 430 may store in the conversation database 500 each “case configuration” and each “case configuration” constituting the identified first morpheme information. The answer sentence search unit 370 may store each “case structure” and each “morpheme” associated with each “case structure” constituting the searched answer sentence in the conversation database 500.
[0219]
The conversation range determination unit 340 may store the searched conversation range in the conversation database 500. The topic search unit 360 may store the searched second morpheme information in the conversation database 500.
[0220]
The first morpheme information, the second morpheme information, each “case composition” that constitutes the first morpheme information or the second morpheme information, each morpheme associated with each “case composition”, and the retrieved answer sentence Each "case structure" and each morpheme associated with each "case structure" and the searched discourse range are associated with each other and stored in the conversation database 500 or the reversal element database 802 as history morpheme information. be able to.
[0221]
The abbreviated sentence complementing unit 350 does not include a morpheme from each attribute (subject, object, action, etc .; case configuration) constituting the first morpheme information based on the first morpheme information extracted by the phrase analysis unit 420. The attribute is searched, and the history morpheme information stored in the conversation database 500 or the return element database 802 is added to the attribute based on the searched attribute.
[0222]
Specifically, the abbreviated sentence complementing unit 350 to which the topic search command signal is input from the discourse range determination unit 340 is based on the first morpheme information included in the input discourse search command signal, and the utterance including the first morpheme information. If the content is an abbreviated sentence, and the utterance content made up of the first morpheme information is an abbreviated sentence (for example, the subject, object, or action does not have a predetermined morpheme), the conversation database 500 or The history form information stored in the return element database 802 is added to the first morpheme information.
[0223]
That is, assuming that the subject included in the history form information is S1, the object is O1, the action A1, the discourse range is D1, and the omitted first morpheme information is W, the supplemented first morpheme information W1 is S1SW , O1∪W, A1∪W, or D1∪W.
[0224]
The topic search unit 360 collates the first morpheme information W1 supplemented by the abbreviated sentence complement unit 350 and each second morpheme information, and from each “topic title” (second morpheme information), the first morpheme information The second morpheme information including W1 is searched, and the searched topic title is output to the answer sentence search unit 370 and the utterance type determination unit 440 as a search result signal.
[0225]
Thereby, even if the utterance content composed of the first morpheme information is an abbreviated sentence and is not clear as Japanese, the abbreviated sentence complementing unit 350 uses the history form information stored in the conversation database 500, Since the omitted morpheme of the first morpheme information can be complemented, the utterance content including the omitted first morpheme information can be clarified.
[0226]
For this reason, when the abbreviated sentence complementing part 350 is the abbreviated sentence which comprises 1st morpheme information, 1st morpheme information is set so that the utterance content which consists of 1st morpheme information becomes appropriate Japanese. Since the morpheme omitted in FIG. 6 can be supplemented, the topic search unit 360 is based on the first morpheme information supplemented with the morpheme, and the optimal “topic title” (second morpheme) related to the first morpheme information. Information) can be acquired, and the answer sentence search unit 370 can output the answer content more suitable for the user's utterance content based on the optimal “topic title” acquired by the topic search unit 360. .
[0227]
(Fifth change example)
The topic search unit 360 may include a deletion unit 361 and a discourse addition unit 362 as shown in FIG. Based on the searched second morpheme information, the deletion unit 361 collates the second morpheme information with the discourse range searched by the discourse range determination unit 340, and from among the morphemes constituting the second morpheme information, It is a deletion means for deleting a morpheme that matches the range.
[0228]
Specifically, the topic search unit 360 to which the topic search command signal is input from the abbreviated sentence complement unit 350 receives the first morpheme information included in the input topic search command signal and the discourse determined by the discourse range determination unit 340. Each second morpheme information belonging to the range is collated, and second morpheme information matching the first morpheme information is searched from each second morpheme information.
[0229]
Then, based on the searched second morpheme information, the deletion unit 361 collates the second morpheme information with the morphemes constituting the discourse range determined by the discourse range determination unit 340, and stores the second morpheme information. Then, the morpheme that matches the morpheme constituting the discourse range is deleted, and the second morpheme information from which the morpheme is deleted is output to the discourse adding unit 362 as a delete signal.
[0230]
That is, the deletion unit 361 removes (removes) the current discourse range D2 (this D2 is made of morphemes) determined by the discourse range determination unit 340 from each morpheme t1 constituting the second morpheme information. If the result is t2, t2 = t1-D2).
[0231]
The discourse adding unit 362 acquires another discourse range associated with the discourse range searched by the discourse range determining unit 340 based on the second morpheme information from which the morpheme has been deleted by the deletion unit 361, This is a discourse adding means for adding the morpheme constituting the discourse range to the second morpheme information.
[0232]
More specifically, if the current discourse range D2 is related to the answer sentence K1, and the discourse range is DK, other discourses related to the answer sentence K1 or the current discourse range D2 (those that have a sibling relationship). Since the range D3 can be expressed as D3 = D2∪DK, the second morpheme information W2 after adding the morpheme constituting the other discourse range D3 can be set to W2 = t2∪D3.
[0233]
For example, each morpheme t1 constituting the second morpheme information is (A movie name; *; interesting) {A movie name is interesting? }, And the current discourse range D2 determined by the discourse range determination unit 340 is (A movie name), the deletion unit 361 first starts from each morpheme t1 (A movie name; *; interesting). The conversation range D2 (A movie name) is deleted, and the deleted result is set to t2 (*; *; interesting) (t2 = t1-D2).
[0234]
When the other conversation range D3 related to the current conversation range D2 (A movie name) is “B movie name”, the second morpheme information after adding the morpheme constituting the other conversation range D3 W2 is t2∪D3, so (B movie name; *; funny) {B movie name is interesting? }.
[0235]
Thus, when the user's utterance content is “A movie name is interesting?”, The discourse adding unit 362 matches each morpheme (A movie name; *; interesting) constituting the user's utterance content. Second morpheme information (A movie name; *; interesting), other second morpheme information (B movie name; *; interesting) {B movie name is interesting? }, The answer sentence search unit 370 acquires the answer sentence (for example, “B movie name is interesting”) associated with the second morpheme information changed by the discourse adding part 362, The acquired answer text can be output.
[0236]
As a result, the answer sentence search unit 370 does not directly output the answer sentence for the user's utterance contents, but based on the second morpheme information including the morpheme added by the discourse addition part 362, the utterance contents Therefore, the output unit 600 can output a more humane answer sentence based on the answer sentence searched by the answer sentence search unit 370.
[0237]
Note that the discourse adding unit 362 is not limited to adding the other discourse range to the second morpheme information from which the morpheme has been deleted, but to the second morpheme information from which the morpheme has been deleted. (Stored in the database 500) may be added.
[0238]
(Sixth change example)
When the topic search unit 360 cannot search the second morpheme information including the first morpheme information from the second morpheme information, the topic search unit 360 collates the first morpheme information with each answer content, When the answer content including the first morpheme information can be searched from among the first morpheme information, the first search unit may acquire the second morpheme information associated with the searched answer content.
[0239]
Specifically, the topic search unit 360, to which the topic search command signal is input from the abbreviated sentence complement unit 350, based on the first morpheme information included in the input topic search command signal, If the second morpheme information that matches the first morpheme information cannot be obtained from each second morpheme information by collating with the morpheme information, as shown in FIG. The answer sentence associated with the second morpheme information is collated.
[0240]
When the topic search unit 360 determines that the morpheme constituting the first morpheme information (the action or the morpheme associated with the action) is included in the answer sentence by this collation, the answer sentence includes Search for associated second morpheme information.
[0241]
Thereby, even if the topic search unit 360 cannot search the second morpheme information that matches the first morpheme information from each second morpheme information, Since the answer sentence including the morpheme (action or the morpheme associated with the action) that constitutes the user can be identified and the second morpheme information associated with the identified answer sentence can be searched, the user's utterance content 2nd morpheme information corresponding to the 1st morpheme information which constitutes can be searched appropriately.
[0242]
As a result, since the topic search unit 360 can search for the optimal second morpheme information corresponding to the first morpheme information, the answer sentence search unit 370 can search for the optimal second morpheme information searched by the topic search unit 360. Based on the above, it is possible to acquire appropriate answer contents for the user's utterance contents.
[0243]
[program]
The contents described in the conversation control system and the conversation control method can be realized by executing a dedicated program for using a predetermined program language in a general-purpose computer such as a personal computer.
[0244]
Here, as the programming language, the topic that the user wants, the user's emotional level for a certain matter, or the type of statement sentence, affirmative sentence, question sentence, repulsive sentence, etc. are associated with the morpheme according to the semantic content In this embodiment, for example, DKML (Discourse Knowledge Markup Language), XML (eXtensible Markup Language), C language, etc. developed by the inventors can be used.
[0245]
That is, the conversation control device 1 stores data stored in each of the conversation databases 500a to 500d (stored information such as second morpheme information, fixed content, answer sentence, answer type, set group, discourse range, element information, etc.), etc. These parts can be constructed by DKML (Discourse Knowledge Markup Language), XML (eXtensible Markup Language), or the like, and can be realized by executing a program for using the constructed storage information.
[0246]
According to such a program according to the present embodiment, each morpheme constituting the utterance content of the user is identified, the semantic content grasped from each identified morpheme is analyzed, and associated with the analyzed semantic content. A conversation control device, a conversation control system, and a conversation control method that have the effect of being able to output the optimum answer contents corresponding to the user's utterance contents by outputting the answer contents prepared in advance. It can be easily realized by a general purpose computer.
[0247]
In addition, since the developer who develops the conversation control device 1 can hierarchically construct the second morpheme information and the like for searching the answer contents for the user's utterance contents using the language in the database. The conversation control device 1 can acquire the response content for the utterance content from the database through a hierarchical procedure based on the utterance content of the user.
[0248]
In other words, the conversation control device 1 has determined and determined the hierarchy of the user's utterance content (for example, whether the second morpheme information stored in the database is in a higher concept or a lower concept). Appropriate answer contents can be acquired from the answer contents accumulated in advance based on the hierarchy.
[0249]
For this reason, the conversation control device 1 does not collate the first morpheme information composed of the user's utterance content and the previously stored “all” second morpheme information one by one. Since the second morpheme information and the first morpheme information may be collated, the second morpheme information approximate to the first morpheme information can be acquired in a short time.
[0250]
Furthermore, communication between the communication unit 800 and the communication unit 900 may be performed by transmitting and receiving data via a communication network 1000 using a protocol such as DKML. Thereby, for example, when there is no answer content suitable for the user's utterance content in the conversation control device 1, the conversation control device 1 is suitable for the user's utterance content through the communication network 1000 according to the convention such as DKML. It is possible to retrieve the answer contents (described in DKML or the like) and obtain the retrieved answer contents (see FIG. 20).
[0251]
The program can be recorded on a recording medium. As shown in FIG. 23, examples of the recording medium include a hard disk 1100, a floppy disk 1200, a compact disk 1300, an IC chip 1400, a cassette tape 1500, and the like. According to the recording medium on which such a program is recorded, the program can be easily stored, transported, sold, and the like.
[0252]
【The invention's effect】
As described above, according to the present invention, the conversation control device identifies each morpheme constituting the utterance content of the user, analyzes the semantic content grasped from each identified morpheme, and analyzes the analyzed semantic content. It is possible to acquire the answer contents created in advance associated with the. As a result, the conversation control device can acquire the optimum answer content corresponding to the user's utterance content.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a schematic configuration of a conversation control system according to an embodiment.
FIG. 2 is a block diagram showing an internal structure of a conversation control unit and a sentence analysis unit in the present embodiment.
FIG. 3 is a diagram showing the contents of each morpheme extracted by a morpheme extraction unit in the present embodiment.
FIG. 4 is a diagram showing the contents of each phrase extracted by a phrase analysis unit in the present embodiment.
FIG. 5 is a diagram showing the contents of “case” specified by the sentence structure analysis unit in the present embodiment.
FIG. 6 is a diagram illustrating an “uttered sentence type” specified by an utterance type determining unit according to the present embodiment;
FIG. 7 is a diagram showing the contents of each dictionary stored in the utterance type database in the present embodiment.
FIG. 8 is a diagram showing the contents of a hierarchical structure built inside the conversation database in the present embodiment.
FIG. 9 is a diagram showing a detailed relationship of a hierarchical structure built inside a conversation database in the present embodiment.
FIG. 10 is a diagram showing the content of a “topic title” built inside the conversation database in the present embodiment.
FIG. 11 is a diagram showing the content of “answer sentence type” associated with “topic title” built inside the conversation database in the present embodiment.
FIG. 12 is a diagram showing the contents of “topic title” and “answer text” belonging to “discourse range” built inside the conversation database in the present embodiment.
FIG. 13 is a diagram showing the contents of reflection element information stored in a reflection element database in the present embodiment.
FIG. 14 is a diagram showing the contents of a wrapping element and a morpheme of the wrapping element stored in the wrapping element database in the present embodiment.
FIG. 15 is a flowchart showing a procedure of a conversation control method according to the present embodiment.
FIG. 16 is a diagram showing utterance contents organized by a morpheme extraction unit in the first modification.
FIG. 17 is a diagram illustrating an internal configuration of a topic search unit in a second modified example.
FIG. 18 is a diagram illustrating a state in which the ratio calculation unit in the second modification collates each morpheme belonging to “case configuration” and each “topic title” for each “topic title”.
FIG. 19 It is a figure which shows a mode that the ratio calculation part in a 2nd modification collates each morpheme which belongs to "each structure", and each morpheme which belongs to "topic title" for every "case".
FIG. 20 It is a figure which shows schematic structure of the conversation control system in a 3rd modification.
FIG. 21 is a diagram illustrating an internal configuration of a topic search unit in a fifth modification example.
FIG. 22 is a diagram showing how the topic search unit in the sixth modification collates first morpheme information with second morpheme information or an answer sentence.
FIG. 23 is a diagram showing a recording medium for storing a program in the present embodiment.
[Explanation of symbols]
DESCRIPTION OF SYMBOLS 1 ... Conversation control apparatus, 100 ... Input part, 200 ... Speech recognition part, 300 ... Conversation control part, 310 ... Management part, 320 ... Reflective determination part, 321 ... Ratio calculation part, 322 ... Selection part, 330 ... Determination part 340 ... Discourse range determining unit 350 ... abbreviated sentence complementing unit 360 ... topic searching unit 361 ... deleting unit 362 ... discourse adding unit 370 ... answer sentence searching unit 400 ... sentence analyzing unit 410 ... morpheme extracting unit , 420 ... phrase analysis unit, 430 ... sentence structure analysis unit, 440 ... utterance type determination unit, 450 ... morpheme database, 460 ... utterance type database, 500a to 500d ... conversation database, 600 ... output unit, 700 ... speech recognition dictionary storage , 800 ... Communication unit, 801 ... Reflection element database, 802 ... Flip element database, 900 ... Communication unit, 1000 ... Communication network, 1100 Hard disk, 1200 ... floppy disk, 1300 ... compact disc, 1400 ... IC chip, 1500 ... cassette tape

Claims (20)

利用者から入力された入力情報に基づいて、該入力情報を示す文字列を特定する文字認識手段と、
前記文字認識手段で特定された前記文字列に基づいて、該文字列の最小単位を構成する各形態素を第一形態素情報として抽出する形態素抽出手段と、
前記利用者からの前記入力情報に対して定型的な内容を回答するための定型内容を予め複数記憶する定型記憶手段と、
前記形態素抽出手段で抽出された前記第一形態素情報と前記各定型内容とを照合し、該各定型内容の中から、該第一形態素情報を含む前記定型内容を取得する定型取得手段と
回答取得手段で取得された過去の回答内容の履歴を記憶する履歴記憶手段と、
前記利用者から入力された前記入力情報に合意するための合意内容を予め記憶する合意記憶手段とを有し、
前記定型取得手段は、前記形態素抽出手段で取得された現在の前記第一形態素情報と過去の前記回答内容とを照合し、現在の該第一形態素情報が過去の該回答内容に含まれる場合には、前記合意内容を取得する
ことを特徴とする会話制御システム。
Character recognition means for identifying a character string indicating the input information based on the input information input by the user;
Based on the character string specified by the character recognition means, morpheme extraction means for extracting each morpheme constituting the minimum unit of the character string as first morpheme information;
Fixed form storage means for previously storing a plurality of fixed contents for answering fixed contents in response to the input information from the user;
A fixed form acquisition means for collating the first morpheme information extracted by the morpheme extraction means with the fixed form contents, and acquiring the fixed form contents including the first morpheme information from the fixed form contents ;
History storage means for storing a history of past answer contents acquired by the answer acquisition means;
An agreement storage means for preliminarily storing agreement content for agreeing on the input information input from the user;
The fixed form acquisition unit collates the current first morpheme information acquired by the morpheme extraction unit with the past response content, and the current first morpheme information is included in the past response content. Get the agreement content
Conversation control system characterized by that.
利用者から入力された入力情報に基づいて、該入力情報を示す文字列を特定する文字認識手段と、Character recognition means for identifying a character string indicating the input information based on the input information input by the user;
前記文字認識手段で特定された前記文字列に基づいて、該文字列の最小単位を構成する各形態素を第一形態素情報として抽出する形態素抽出手段と、  Based on the character string specified by the character recognition means, morpheme extraction means for extracting each morpheme constituting the minimum unit of the character string as first morpheme information;
前記利用者からの前記入力情報に対して定型的な内容を回答するための定型内容を予め複数記憶する定型記憶手段と、  Fixed form storage means for previously storing a plurality of fixed contents for answering fixed contents in response to the input information from the user;
前記形態素抽出手段で抽出された前記第一形態素情報と前記各定型内容とを照合し、該各定型内容の中から、該第一形態素情報を含む前記定型内容を取得する定型取得手段とを有し、  The first morpheme information extracted by the morpheme extraction unit is collated with each fixed content, and the fixed form acquisition unit is provided for acquiring the fixed content including the first morpheme information from the fixed content. And
前記履歴記憶手段には、前記定型取得手段で取得された過去の前記第一形態素情報が記憶され、The history storage means stores the past first morpheme information acquired by the fixed form acquisition means,
前記利用者に対して反発するための反発内容を予め記憶する反発記憶手段を有し、  Repulsion storage means for preliminarily storing repulsion contents for repulsion against the user;
前記定型取得手段は、前記形態素抽出手段で取得された現在の前記第一形態素情報と過去の前記第一形態素情報とを照合し、現在の該第一形態素情報が過去の該第一形態素情報に含まれる場合には、前記反発内容を取得する  The fixed form acquisition unit collates the current first morpheme information acquired by the morpheme extraction unit with the past first morpheme information, and the current first morpheme information is converted into the past first morpheme information. If included, get the repulsion content
ことを特徴とする会話制御システム。Conversation control system characterized by that.
利用者から入力されるであろう入力情報又は利用者への回答内容に関連性のある形態素を示す談話範囲には、一つの文字、複数の文字列又はこれらの組み合わせからなる前記形態素を示す第二形態素情報が複数関連付けられ、前記各第二形態素情報には、前記利用者への前記回答内容がそれぞれに関連付けてられており、該談話範囲を予め複数記憶する談話記憶手段と、
前記形態素抽出手段で抽出された前記第一形態素情報と前記各談話範囲とを照合し、該各談話範囲の中から、該第一形態素情報を含む前記談話範囲を検索する談話検索手段と、
前記談話検索手段で検索された前記談話範囲に関連付けられている前記各第二形態素情報と、前記形態素抽出手段で抽出された前記第一形態素情報とを照合し、該各第二形態素情報の中から、該第一形態素情報を含む前記第二形態素情報を検索する第一検索手段と、
前記第一検索手段で検索された前記第二形態素情報に基づいて、該第二形態素情報に関連付けられた前記回答内容を取得する回答取得手段と、
前記第一検索手段で検索された前記第二形態素情報に基づいて、該第二形態素情報と前記談話検索手段で検索された前記談話範囲とを照合し、該第二形態素情報を構成する 各形態素の中から、該談話範囲と一致する前記形態素を削除する削除手段と、
前記削除手段で前記形態素が削除された前記第二形態素情報に基づいて、前記談話検索手段で検索された前記談話範囲に関連付けられた他の談話範囲を取得し、取得した前記他の談話範囲を構成する前記形態素を、該第二形態素情報に付加する談話付加手段とを有し、
前記回答取得手段は、前記談話付加手段で前記形態素が付加された前記第二形態素情報に基づいて、該第二形態素情報に関連付けられた前記回答内容を取得する
ことを特徴とする会話制御システム。
The discourse range indicating the morpheme related to the input information that will be input by the user or the response content to the user includes the first morpheme that includes one character, a plurality of character strings, or a combination thereof. A plurality of dimorpheme information is associated with each of the second morpheme information, the content of the answer to the user is associated with each, a discourse storage means for storing a plurality of discourse ranges in advance,
A discourse search means for collating the first morpheme information extracted by the morpheme extraction means and the discourse ranges, and searching the discourse range including the first morpheme information from the discourse ranges;
The second morpheme information associated with the discourse range searched by the discourse search means is collated with the first morpheme information extracted by the morpheme extraction means, From the first search means for searching the second morpheme information including the first morpheme information,
Based on the second morpheme information searched by the first search unit, an answer acquisition unit that acquires the response content associated with the second morpheme information;
Based on the second morpheme information searched by the first search means, the second morpheme information is collated with the discourse range searched by the discourse search means, and each morpheme constituting the second morpheme information Deleting means for deleting the morpheme that matches the discourse range from
Based on the second morpheme information from which the morpheme has been deleted by the deletion unit, obtains another discourse range associated with the discourse range searched by the discourse search unit, and acquires the acquired other discourse range. A discourse adding means for adding the morpheme to the second morpheme information;
The conversation control system characterized in that the answer acquisition means acquires the answer content associated with the second morpheme information based on the second morpheme information to which the morpheme is added by the discourse addition means .
利用者から入力されるであろう入力情報又は利用者への回答内容に関連性のある形態素を示す談話範囲には、一つの文字、複数の文字列又はこれらの組み合わせからなる前記形態素を示す第二形態素情報が複数関連付けられ、前記各第二形態素情報には、前記利用者への前記回答内容がそれぞれに関連付けてられており、該談話範囲を予め複数記憶する談話記憶手段と、
前記形態素抽出手段で抽出された前記第一形態素情報と前記各談話範囲とを照合し、該各談話範囲の中から、該第一形態素情報を含む前記談話範囲を検索する談話検索手段と、
前記談話検索手段で検索された前記談話範囲に関連付けられている前記各第二形態素情報と、前記形態素抽出手段で抽出された前記第一形態素情報とを照合し、該各第二形態素情報の中から、該第一形態素情報を含む前記第二形態素情報を検索する第一検索手段と、
前記第一検索手段で検索された前記第二形態素情報に基づいて、該第二形態素情報に関連付けられた前記回答内容を取得する回答取得手段と、
前記第一検索手段は、前記各第二形態素情報の中から、前記第一形態素情報を含む前記第二形態素情報を検索することができない場合に、該第一形態素情報と前記各回答内容とを照合し、該各回答内容の中から、該第一形態素情報を含む前記回答内容を検索することができたときは、検索した前記回答内容に関連付けられている前記第二形態素情報を取得する
ことを特徴とする会話制御システム。
The discourse range indicating the morpheme related to the input information that will be input by the user or the response content to the user includes the first morpheme that includes one character, a plurality of character strings, or a combination thereof. A plurality of dimorpheme information is associated with each of the second morpheme information, the content of the answer to the user is associated with each, a discourse storage means for storing a plurality of discourse ranges in advance,
A discourse search means for collating the first morpheme information extracted by the morpheme extraction means and the discourse ranges, and searching the discourse range including the first morpheme information from the discourse ranges;
The second morpheme information associated with the discourse range searched by the discourse search means is collated with the first morpheme information extracted by the morpheme extraction means, From the first search means for searching the second morpheme information including the first morpheme information,
Based on the second morpheme information searched by the first search unit, an answer acquisition unit that acquires the response content associated with the second morpheme information;
The first search means, when the second morpheme information including the first morpheme information cannot be searched from the respective second morpheme information, When the response contents including the first morpheme information can be searched from the respective response contents, the second morpheme information associated with the searched response contents is acquired. Conversation control system characterized by
利用者から入力された入力情報に基づいて、該入力情報に適した回答を取得する会話制御装置の会話制御方法であって、A conversation control method for a conversation control device that acquires an answer suitable for the input information based on input information input from a user,
定型記憶手段が、前記利用者からの前記入力情報に対して定型的な内容を回答するための定型内容を予め複数記憶するステップと、   A step of storing in advance a plurality of fixed contents for replying fixed contents to the input information from the user;
文字認識手段が、前記利用者から入力された前記入力情報に基づいて、該入力情報を示す文字列を特定するステップと、  A step of identifying a character string indicating the input information based on the input information input by the user;
形態素抽出手段が、前記文字認識手段で特定された前記文字列に基づいて、該文字列の最小単位を構成する各形態素を第一形態素情報として抽出するステップと、  Morpheme extraction means, based on the character string specified by the character recognition means, to extract each morpheme constituting the minimum unit of the character string as first morpheme information;
定型取得手段が、前記形態素抽出手段で抽出された前記第一形態素情報と前記各定型内容とを照合し、該各定型内容の中から、該第一形態素情報を含む前記定型内容を取得するステップと、  A step of obtaining a fixed content including the first morpheme information from the fixed content by comparing the first morpheme information extracted by the morpheme extracting device with the fixed content, When,
履歴記憶手段が、回答取得手段で取得された過去の回答内容の履歴を記憶するステップと、A history storage means for storing a history of past answer contents acquired by the answer acquisition means;
合意記憶手段が、前記利用者から入力された前記入力情報に合意するための合意内容を予め記憶するステップと、  An agreement storage means for preliminarily storing agreement contents for agreeing to the input information input from the user;
前記定型取得手段が、前記形態素抽出手段で取得された現在の前記第一形態素情報と過去の前記回答内容とを照合し、現在の該第一形態素情報が過去の該回答内容に含まれる場合には、前記合意内容を取得するステップと、  When the fixed form acquisition unit collates the current first morpheme information acquired by the morpheme extraction unit with the past response content, and the current first morpheme information is included in the past response content Obtaining the content of the agreement;
を有することを特徴とする会話制御方法。A conversation control method characterized by comprising:
利用者から入力された入力情報に基づいて、該入力情報に適した回答を取得する会話制御装置の会話制御方法であって、A conversation control method for a conversation control device that acquires an answer suitable for the input information based on input information input from a user,
定型記憶手段が、前記利用者からの前記入力情報に対して定型的な内容を回答す  A fixed form storage means answers a fixed content to the input information from the user. るための定型内容を予め複数記憶するステップと、 Storing in advance a plurality of standard contents for
文字認識手段が、前記利用者から入力された前記入力情報に基づいて、該入力情報を示す文字列を特定するステップと、  A step of identifying a character string indicating the input information based on the input information input by the user;
形態素抽出手段が、前記文字認識手段で特定された前記文字列に基づいて、該文字列の最小単位を構成する各形態素を第一形態素情報として抽出するステップと、  Morpheme extraction means, based on the character string specified by the character recognition means, to extract each morpheme constituting the minimum unit of the character string as first morpheme information;
定型取得手段が、前記形態素抽出手段で抽出された前記第一形態素情報と前記各定型内容とを照合し、該各定型内容の中から、該第一形態素情報を含む前記定型内容を取得するステップと、  A step of obtaining a fixed content including the first morpheme information from the fixed content by comparing the first morpheme information extracted by the morpheme extracting device with the fixed content, When,
履歴記憶手段が、前記定型取得手段で取得された過去の前記第一形態素情報を記憶するステップと、A history storage unit storing the past first morpheme information acquired by the fixed form acquisition unit;
反発記憶手段が、前記利用者に対して反発するための反発内容を予め記憶するステップと、  A step in which repulsion storage means stores in advance repulsion contents for repelling the user;
前記定型取得手段が、前記形態素抽出手段で取得された現在の前記第一形態素情報と過去の前記第一形態素情報とを照合し、現在の該第一形態素情報が過去の該第一形態素情報に含まれる場合には、前記反発内容を取得するステップとを有することを特徴とする会話制御方法。  The fixed form acquisition means collates the current first morpheme information acquired by the morpheme extraction means with the previous first morpheme information, and the current first morpheme information becomes the past first morpheme information. If it is included, a step for acquiring the repulsion content is included.
談話記憶手段が、利用者から入力されるであろう入力情報又は利用者への回答内容に関連性のある形態素を示す談話範囲には、一つの文字、複数の文字列又はこれらの組み合わせからなる前記形態素を示す第二形態素情報が複数関連付けられ、前記各第二形態素情報には、前記利用者への前記回答内容がそれぞれに関連付けてられており、該談話範囲を複数記憶するステップと、The discourse storage means includes a single character, a plurality of character strings, or a combination thereof in the discourse range indicating morphemes relevant to the input information that will be input by the user or the response content to the user. A plurality of second morpheme information indicating the morpheme, each of the second morpheme information is associated with the content of the answer to the user, and storing a plurality of the discourse ranges;
談話検索手段が、形態素抽出手段で抽出された前記第一形態素情報と前記各談話範囲とを照合し、該各談話範囲の中から、該第一形態素情報を含む前記談話範囲を検索するステップと、  A discourse search means for collating the first morpheme information extracted by the morpheme extraction means with the discourse ranges, and searching the discourse range including the first morpheme information from the discourse ranges; ,
第1検索手段が、前記談話検索手段で検索された前記談話範囲に関連付けられている前記各第二形態素情報と、前記形態素抽出手段で抽出された前記第一形態素情報とを照合し、該各第二形態素情報の中から、該第一形態素情報を含む前記第二形態素情報を検索するステップと、  The first search means collates the second morpheme information associated with the discourse range searched by the discourse search means with the first morpheme information extracted by the morpheme extraction means, Searching the second morpheme information including the first morpheme information from second morpheme information;
回答取得手段が、前記第1検索手段で検索された前記第二形態素情報に基づいて、該第二形態素情報に関連付けられた前記回答内容を取得するステップと、  A step of acquiring an answer content associated with the second morpheme information based on the second morpheme information searched by the first search unit;
削除手段が、前記第1検索手段で検索された前記第二形態素情報に基づいて、該第二形態素情報と前記談話検索手段で検索された前記談話範囲とを照合し、該第二形態素情報を構成する各形態素の中から、該談話範囲と一致する前記形態素を削除するステップと、The deleting means collates the second morpheme information with the discourse range searched by the discourse search means based on the second morpheme information searched by the first search means, Deleting the morpheme that matches the discourse range from each of the constituent morphemes;
談話付加手段が、前記削除手段で前記形態素が削除された前記第二形態素情報に基づいて、前記談話検索手段で検索された前記談話範囲に関連付けられた他の談話範囲を取得し、取得した前記他の談話範囲を構成する前記形態素を、該第二形態素情報に付加するステップと、  The discourse adding means acquires another discourse range associated with the discourse range searched by the discourse search means based on the second morpheme information from which the morpheme has been deleted by the deleting means, and the acquired Adding the morpheme constituting another discourse range to the second morpheme information;
前記回答取得手段が、前記談話付加手段で前記形態素が付加された前記第二形態素情報に基づいて、該第二形態素情報に関連付けられた前記回答内容を取得するステップと  The answer acquisition means acquires the answer content associated with the second morpheme information based on the second morpheme information to which the morpheme is added by the discourse addition means;
を有することを特徴とする会話制御方法。A conversation control method characterized by comprising:
談話記憶手段が、利用者から入力されるであろう入力情報又は利用者への回答内容に関連性のある形態素を示す談話範囲には、一つの文字、複数の文字列又はこれらの組み合わせからなる前記形態素を示す第二形態素情報が複数関連付けられ、前記各第二形態素情報には、前記利用者への前記回答内容がそれぞれに関連付けてられており、該談話範囲を複数記憶するステップと、The discourse storage means includes a single character, a plurality of character strings, or a combination thereof in the discourse range indicating morphemes relevant to the input information that will be input by the user or the response content to the user. A plurality of second morpheme information indicating the morpheme, each of the second morpheme information is associated with the content of the answer to the user, and storing a plurality of the discourse ranges;
談話検索手段が、形態素抽出手段で抽出された前記第一形態素情報と前記各談話範囲とを照合し、該各談話範囲の中から、該第一形態素情報を含む前記談話範囲を検索するステップと、  A discourse search means for collating the first morpheme information extracted by the morpheme extraction means with the discourse ranges, and searching the discourse range including the first morpheme information from the discourse ranges; ,
第1検索手段が、前記談話検索手段で検索された前記談話範囲に関連付けられている前記各第二形態素情報と、前記形態素抽出手段で抽出された前記第一形態素情報とを照合し、該各第二形態素情報の中から、該第一形態素情報を含む前記第二形態素情報を検索するステップと、  The first search means collates the second morpheme information associated with the discourse range searched by the discourse search means with the first morpheme information extracted by the morpheme extraction means, Searching the second morpheme information including the first morpheme information from second morpheme information;
回答取得手段が、前記第1検索手段で検索された前記第二形態素情報に基づいて、該第二形態素情報に関連付けられた前記回答内容を取得するステップと、  A step of acquiring an answer content associated with the second morpheme information based on the second morpheme information searched by the first search unit;
前記第1検索手段が、前記各第二形態素情報の中から、前記第一形態素情報を含む前記第二形態素情報を検索することができない場合に、該第一形態素情報と前記各回答内容とを照合し、該各回答内容の中から、該第一形態素情報を含む前記回答内容を検索することができたときは、検索した前記回答内容に関連付けられている前記第二形態素情報を取得するステップを有することを特徴とする会話制御方法。When the first search means cannot search the second morpheme information including the first morpheme information from the second morpheme information, the first morpheme information and the contents of the answers are obtained. A step of collating and obtaining the second morpheme information associated with the searched answer content when the answer content including the first morpheme information can be searched from the answer contents A conversation control method characterized by comprising:
利用者から入力された入力情報に基づいて、該入力情報に適した回答を取得する会話制御装置のプログラムであって、コンピュータに、A program for a conversation control device that acquires an answer suitable for the input information based on the input information input from a user, the computer,
定型記憶手段が、前記利用者からの前記入力情報に対して定型的な内容を回答するための定型内容を予め複数記憶するステップと、   A step of storing in advance a plurality of fixed contents for replying fixed contents to the input information from the user;
文字認識手段が、前記利用者から入力された前記入力情報に基づいて、該入力情報を示す文字列を特定するステップと、  A step of identifying a character string indicating the input information based on the input information input by the user;
形態素抽出手段が、前記文字認識手段で特定された前記文字列に基づいて、該文字列の最小単位を構成する各形態素を第一形態素情報として抽出するステップと、  Morpheme extraction means, based on the character string specified by the character recognition means, to extract each morpheme constituting the minimum unit of the character string as first morpheme information;
定型取得手段が、前記形態素抽出手段で抽出された前記第一形態素情報と前記各定型内容とを照合し、該各定型内容の中から、該第一形態素情報を含む前記定型内容を取得するステップと、  A step of obtaining a fixed content including the first morpheme information from the fixed content by comparing the first morpheme information extracted by the morpheme extracting device with the fixed content, When,
履歴記憶手段が、回答取得手段で取得された過去の回答内容の履歴を記憶するステップと、A history storage means for storing a history of past answer contents acquired by the answer acquisition means;
合意記憶手段が、前記利用者から入力された前記入力情報に合意するための合意内容を予め記憶するステップと、  An agreement storage means for preliminarily storing agreement contents for agreeing to the input information input from the user;
前記定型取得手段が、前記形態素抽出手段で取得された現在の前記第一形態素情報と過去の前記回答内容とを照合し、現在の該第一形態素情報が過去の該回答内容に含まれる場合には、前記合意内容を取得するステップと、  When the fixed form acquisition unit collates the current first morpheme information acquired by the morpheme extraction unit with the past response content, and the current first morpheme information is included in the past response content Obtaining the content of the agreement;
を有する処理を実行させるためのプログラム。A program for causing a process to be executed.
利用者から入力された入力情報に基づいて、該入力情報に適した回答を取得する会話制御装置のプログラムであって、コンピュータに、A program for a conversation control device that acquires an answer suitable for the input information based on the input information input from a user, the computer,
定型記憶手段が、前記利用者からの前記入力情報に対して定型的な内容を回答するための定型内容を予め複数記憶するステップと、   A step of storing in advance a plurality of fixed contents for replying fixed contents to the input information from the user;
文字認識手段が、前記利用者から入力された前記入力情報に基づいて、該入力情報を示す文字列を特定するステップと、  A step of identifying a character string indicating the input information based on the input information input by the user;
形態素抽出手段が、前記文字認識手段で特定された前記文字列に基づいて、該文字列の最小単位を構成する各形態素を第一形態素情報として抽出するステップと、  Morpheme extraction means, based on the character string specified by the character recognition means, to extract each morpheme constituting the minimum unit of the character string as first morpheme information;
定型取得手段が、前記形態素抽出手段で抽出された前記第一形態素情報と前記各定型内容とを照合し、該各定型内容の中から、該第一形態素情報を含む前記定型内容を取得するステップと、  A step of obtaining a fixed content including the first morpheme information from the fixed content by comparing the first morpheme information extracted by the morpheme extracting device with the fixed content, When,
履歴記憶手段が、前記定型取得手段で取得された過去の前記第一形態素情報を記憶するステップと、A history storage unit storing the past first morpheme information acquired by the fixed form acquisition unit;
反発記憶手段が、前記利用者に対して反発するための反発内容を予め記憶するステップと、  A step in which repulsion storage means stores in advance repulsion contents for repelling the user;
前記定型取得手段が、前記形態素抽出手段で取得された現在の前記第一形態素情報と過去の前記第一形態素情報とを照合し、現在の該第一形態素情報が過去の該第一形態素情報に含まれる場合には、前記反発内容を取得するステップと、  The fixed form acquisition means collates the current first morpheme information acquired by the morpheme extraction means with the previous first morpheme information, and the current first morpheme information becomes the past first morpheme information. If included, obtaining the repulsion content;
を有する処理を実行させるためのプログラム。A program for causing a process to be executed.
利用者から入力された入力情報に基づいて、該入力情報に適しSuitable for input information based on input information input by the user た回答を取得する会話制御装置のプログラムであって、コンピュータに、A program for a conversation control device that obtains a reply to a computer,
談話記憶手段が、前記利用者から入力されるであろう入力情報又は利用者への回答内容に関連性のある形態素を示す談話範囲には、一つの文字、複数の文字列又はこれらの組み合わせからなる前記形態素を示す第二形態素情報が複数関連付けられ、前記各第二形態素情報には、前記利用者への前記回答内容がそれぞれに関連付けてられており、該談話範囲を複数記憶するステップと、The discourse storage means includes a single character, a plurality of character strings, or a combination thereof in the discourse range indicating morphemes relevant to the input information that will be input from the user or the response content to the user. A plurality of second morpheme information indicating the morpheme, and each second morpheme information is associated with the content of the answer to the user, respectively, and storing a plurality of the discourse ranges;
談話検索手段が、形態素抽出手段で抽出された前記第一形態素情報と前記各談話範囲とを照合し、該各談話範囲の中から、該第一形態素情報を含む前記談話範囲を検索するステップと、  A discourse search means for collating the first morpheme information extracted by the morpheme extraction means with the discourse ranges, and searching the discourse range including the first morpheme information from the discourse ranges; ,
第1検索手段が、前記談話検索手段で検索された前記談話範囲に関連付けられている前記各第二形態素情報と、前記形態素抽出手段で抽出された前記第一形態素情報とを照合し、該各第二形態素情報の中から、該第一形態素情報を含む前記第二形態素情報を検索するステップと、  The first search means collates the second morpheme information associated with the discourse range searched by the discourse search means with the first morpheme information extracted by the morpheme extraction means, Searching the second morpheme information including the first morpheme information from second morpheme information;
回答取得手段が、前記第1検索手段で検索された前記第二形態素情報に基づいて、該第二形態素情報に関連付けられた前記回答内容を取得するステップと、  A step of acquiring an answer content associated with the second morpheme information based on the second morpheme information searched by the first search unit;
削除手段が、前記第1検索手段で検索された前記第二形態素情報に基づいて、該第二形態素情報と前記談話検索手段で検索された前記談話範囲とを照合し、該第二形態素情報を構成する各形態素の中から、該談話範囲と一致する前記形態素を削除するステップと、The deleting means collates the second morpheme information with the discourse range searched by the discourse search means based on the second morpheme information searched by the first search means, Deleting the morpheme that matches the discourse range from each of the constituent morphemes;
談話付加手段が、前記削除手段で前記形態素が削除された前記第二形態素情報に基づいて、前記談話検索手段で検索された前記談話範囲に関連付けられた他の談話範囲を取得し、取得した前記他の談話範囲を構成する前記形態素を、該第二形態素情報に付加するステップと、  The discourse adding means acquires another discourse range associated with the discourse range searched by the discourse search means based on the second morpheme information from which the morpheme has been deleted by the deleting means, and the acquired Adding the morpheme constituting another discourse range to the second morpheme information;
前記回答取得手段が、前記談話付加手段で前記形態素が付加された前記第二形態素情報に基づいて、該第二形態素情報に関連付けられた前記回答内容を取得するステップと、  The answer acquiring means acquires the answer content associated with the second morpheme information based on the second morpheme information to which the morpheme has been added by the discourse adding means;
を有する処理を実行させるためのプログラム。A program for causing a process to be executed.
利用者から入力された入力情報に基づいて、該入力情報に適した回答を取得する会話制御装置のプログラムであって、コンピュータに、A program for a conversation control device that acquires an answer suitable for the input information based on the input information input from a user, the computer,
談話記憶手段が、利用者から入力されるであろう入力情報又は利用者への回答内容に関連性のある形態素を示す談話範囲には、一つの文字、複数の文字列又はこれらの組み合わせからなる前記形態素を示す第二形態素情報が複数関連付けられ、前記各第二形態素情報には、前記利用者への前記回答内容がそれぞれに関連付けてられており、該談話範囲を複数記憶するステップと、The discourse storage means includes a single character, a plurality of character strings, or a combination thereof in the discourse range indicating morphemes relevant to the input information that will be input by the user or the response content to the user. A plurality of second morpheme information indicating the morpheme, each of the second morpheme information is associated with the content of the answer to the user, and storing a plurality of the discourse ranges;
談話検索手段が、形態素抽出手段で抽出された前記第一形態素情報と前記各談話範囲とを照合し、該各談話範囲の中から、該第一形態素情報を含む前記談話範囲を検索するステップと、  A discourse search means for collating the first morpheme information extracted by the morpheme extraction means with the discourse ranges, and searching the discourse range including the first morpheme information from the discourse ranges; ,
第1検索手段が、前記談話検索手段で検索された前記談話範囲に関連付けられている前記各第二形態素情報と、前記形態素抽出手段で抽出された前記第一形態素情報とを照合し、該各第二形態素情報の中から、該第一形態素情報を含む前記第二形態素情報を検索するステップと、  The first search means collates the second morpheme information associated with the discourse range searched by the discourse search means with the first morpheme information extracted by the morpheme extraction means, Searching the second morpheme information including the first morpheme information from second morpheme information;
回答取得手段が、前記第1検索手段で検索された前記第二形態素情報に基づいて、該第二形態素情報に関連付けられた前記回答内容を取得するステップと、  A step of acquiring an answer content associated with the second morpheme information based on the second morpheme information searched by the first search unit;
前記第1検索手段が、前記各第二形態素情報の中から、前記第一形態素情報を含む前記第二形態素情報を検索することができない場合に、該第一形態素情報と前記各回答内容とを照合し、該各回答内容の中から、該第一形態素情報を含む前記回答内容を検索することができたときは、検索した前記回答内容に関連付けられている前記第二形態素情報を取得するステップと、When the first search means cannot search the second morpheme information including the first morpheme information from the second morpheme information, the first morpheme information and the contents of the answers are obtained. A step of collating and obtaining the second morpheme information associated with the searched answer content when the answer content including the first morpheme information can be searched from the answer contents When,
を有する処理を実行させるためのプログラム。A program for causing a process to be executed.
利用者から入力された入力情報に基づいて、該入力情報に適しSuitable for input information based on input information input by the user た回答を取得する会話制御装置のプログラムを記録した記録媒体であって、コンピュータに、A recording medium for recording a program of a conversation control device for obtaining a reply,
定型記憶手段が、前記利用者からの前記入力情報に対して定型的な内容を回答するための定型内容を予め複数記憶するステップと、   A step of storing in advance a plurality of fixed contents for replying fixed contents to the input information from the user;
文字認識手段が、前記利用者から入力された前記入力情報に基づいて、該入力情報を示す文字列を特定するステップと、  A step of identifying a character string indicating the input information based on the input information input by the user;
形態素抽出手段が、前記文字認識手段で特定された前記文字列に基づいて、該文字列の最小単位を構成する各形態素を第一形態素情報として抽出するステップと、  Morpheme extraction means, based on the character string specified by the character recognition means, to extract each morpheme constituting the minimum unit of the character string as first morpheme information;
定型取得手段が、前記形態素抽出手段で抽出された前記第一形態素情報と前記各定型内容とを照合し、該各定型内容の中から、該第一形態素情報を含む前記定型内容を取得するステップと、  A step of obtaining a fixed content including the first morpheme information from the fixed content by comparing the first morpheme information extracted by the morpheme extracting device with the fixed content, When,
履歴記憶手段が、回答取得手段で取得された過去の回答内容の履歴を記憶するステップと、A history storage means for storing a history of past answer contents acquired by the answer acquisition means;
合意記憶手段が、前記利用者から入力された前記入力情報に合意するための合意内容を予め記憶するステップと、  An agreement storage means for preliminarily storing agreement contents for agreeing to the input information input from the user;
前記定型取得手段が、前記形態素抽出手段で取得された現在の前記第一形態素情報と過去の前記回答内容とを照合し、現在の該第一形態素情報が過去の該回答内容に含まれる場合には、前記合意内容を取得するステップと、  When the fixed form acquisition unit collates the current first morpheme information acquired by the morpheme extraction unit with the past response content, and the current first morpheme information is included in the past response content Obtaining the content of the agreement;
を有する処理を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。A computer-readable recording medium having recorded thereon a program for executing a process including:
利用者から入力された入力情報に基づいて、該入力情報に適した回答を取得する会話制御装置のプログラムを記録した記録媒体であって、コンピュータに、A recording medium recording a program of a conversation control device that acquires an answer suitable for the input information based on input information input from a user, the computer,
定型記憶手段が、前記利用者からの前記入力情報に対して定型的な内容を回答するための定型内容を予め複数記憶するステップと、  A step of storing in advance a plurality of fixed contents for replying fixed contents to the input information from the user;
文字認識手段が、前記利用者から入力された前記入力情報に基づいて、該入力情報を示す文字列を特定するステップと、  A step of identifying a character string indicating the input information based on the input information input by the user;
形態素抽出手段が、前記文字認識手段で特定された前記文字列に基づいて、該文字列の最小単位を構成する各形態素を第一形態素情報として抽出するステップと、  Morpheme extraction means, based on the character string specified by the character recognition means, to extract each morpheme constituting the minimum unit of the character string as first morpheme information;
定型取得手段が、前記形態素抽出手段で抽出された前記第一形態素情報と前記各定型内容とを照合し、該各定型内容の中から、該第一形態素情報を含む前記定型内容を取得するステップと、  A step of obtaining a fixed content including the first morpheme information from the fixed content by comparing the first morpheme information extracted by the morpheme extracting device with the fixed content, When,
履歴記憶手段が、前記定型取得手段で取得された過去の前記第一形態素情報を記憶するステップと、A history storage unit storing the past first morpheme information acquired by the fixed form acquisition unit;
反発記憶手段が、前記利用者に対して反発するための反発内容を予め記憶するステップと、  A step in which repulsion storage means stores in advance repulsion contents for repelling the user;
前記定型取得手段が、前記形態素抽出手段で取得された現在の前記第一形態素情報と過去の前記第一形態素情報とを照合し、現在の該第一形態素情報が過去の該第一形態素情報に含まれる場合には、前記反発内容を取得するステップと、  The fixed form acquisition means collates the current first morpheme information acquired by the morpheme extraction means with the previous first morpheme information, and the current first morpheme information becomes the past first morpheme information. If included, obtaining the repulsion content;
を有する処理を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。A computer-readable recording medium having recorded thereon a program for executing a process including:
利用者から入力された入力情報に基づいて、該入力情報に適した回答を取得する会話制御装置のプログラムを記録した記録媒体であって、コンピュータに、A recording medium recording a program of a conversation control device that acquires an answer suitable for the input information based on input information input from a user, the computer,
談話記憶手段が、前記利用者から入力されるであろう入力情報又は利用者への回答内容に関連性のある形態素を示す談話範囲には、一つの文字、複数の文字列又はこれらの組み合わせからなる前記形態素を示す第二形態素情報が複数関連付けられ、前記各第二形態素情報には、前記利用者への前記回答内容がそれぞれに関連付けてられており、該談話範囲を複数記憶するステップと、The discourse storage means includes a single character, a plurality of character strings, or a combination thereof in the discourse range indicating morphemes relevant to the input information that will be input from the user or the response content to the user. A plurality of second morpheme information indicating the morpheme, and each second morpheme information is associated with the content of the answer to the user, respectively, and storing a plurality of the discourse ranges;
談話検索手段が、形態素抽出手段で抽出された前記第一形態素情報と前記各談話  The discourse search means includes the first morpheme information extracted by the morpheme extraction means and each discourse. 範囲とを照合し、該各談話範囲の中から、該第一形態素情報を含む前記談話範囲を検索するステップと、A range is searched, and the discourse range including the first morpheme information is searched from the discourse ranges,
第1検索手段が、前記談話検索手段で検索された前記談話範囲に関連付けられている前記各第二形態素情報と、前記形態素抽出手段で抽出された前記第一形態素情報とを照合し、該各第二形態素情報の中から、該第一形態素情報を含む前記第二形態素情報を検索するステップと、  The first search means collates the second morpheme information associated with the discourse range searched by the discourse search means with the first morpheme information extracted by the morpheme extraction means, Searching the second morpheme information including the first morpheme information from second morpheme information;
回答取得手段が、前記第1検索手段で検索された前記第二形態素情報に基づいて、該第二形態素情報に関連付けられた前記回答内容を取得するステップと、  A step of acquiring an answer content associated with the second morpheme information based on the second morpheme information searched by the first search unit;
削除手段が、前記第1検索手段で検索された前記第二形態素情報に基づいて、該第二形態素情報と前記談話検索手段で検索された前記談話範囲とを照合し、該第二形態素情報を構成する各形態素の中から、該談話範囲と一致する前記形態素を削除するステップと、The deleting means collates the second morpheme information with the discourse range searched by the discourse search means based on the second morpheme information searched by the first search means, Deleting the morpheme that matches the discourse range from each of the constituent morphemes;
談話付加手段が、前記削除手段で前記形態素が削除された前記第二形態素情報に基づいて、前記談話検索手段で検索された前記談話範囲に関連付けられた他の談話範囲を取得し、取得した前記他の談話範囲を構成する前記形態素を、該第二形態素情報に付加するステップと、  The discourse adding means acquires another discourse range associated with the discourse range searched by the discourse search means based on the second morpheme information from which the morpheme has been deleted by the deleting means, and the acquired Adding the morpheme constituting another discourse range to the second morpheme information;
前記回答取得手段が、前記談話付加手段で前記形態素が付加された前記第二形態素情報に基づいて、該第二形態素情報に関連付けられた前記回答内容を取得するステップと、  The answer acquiring means acquires the answer content associated with the second morpheme information based on the second morpheme information to which the morpheme has been added by the discourse adding means;
を有する処理を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。A computer-readable recording medium having recorded thereon a program for executing a process including:
利用者から入力された入力情報に基づいて、該入力情報に適した回答を取得する会話制御装置のプログラムを記録した記録媒体であって、コンピュータに、A recording medium recording a program of a conversation control device that acquires an answer suitable for the input information based on input information input from a user, the computer,
談話記憶手段が、利用者から入力されるであろう入力情報又は利用者への回答内容に関連性のある形態素を示す談話範囲には、一つの文字、複数の文字列又はこれらの組み合わせからなる前記形態素を示す第二形態素情報が複数関連付けられ、前記各第二形態素情報には、前記利用者への前記回答内容がそれぞれに関連付けてられており、該談話範囲を複数記憶するステップと、The discourse storage means includes a single character, a plurality of character strings, or a combination thereof in the discourse range indicating morphemes relevant to the input information that will be input by the user or the response content to the user. A plurality of second morpheme information indicating the morpheme, each of the second morpheme information is associated with the content of the answer to the user, and storing a plurality of the discourse ranges;
談話検索手段が、形態素抽出手段で抽出された前記第一形態素情報と前記各談話範囲とを照合し、該各談話範囲の中から、該第一形態素情報を含む前記談話範囲を検索するステップと、  A discourse search means for collating the first morpheme information extracted by the morpheme extraction means with the discourse ranges, and searching the discourse range including the first morpheme information from the discourse ranges; ,
第1検索手段が、前記談話検索手段で検索された前記談話範囲に関連付けられている前記各第二形態素情報と、前記形態素抽出手段で抽出された前記第一形態素情報とを照合し、該各第二形態素情報の中から、該第一形態素情報を含む前記第二形態素情報を検索するステップと、  The first search means collates the second morpheme information associated with the discourse range searched by the discourse search means with the first morpheme information extracted by the morpheme extraction means, Searching the second morpheme information including the first morpheme information from second morpheme information;
回答取得手段が、前記第1検索手段で検索された前記第二形態素情報に基づいて、該第二形態素情報に関連付けられた前記回答内容を取得するステップと、  A step of acquiring an answer content associated with the second morpheme information based on the second morpheme information searched by the first search unit;
前記第1検索手段が、前記各第二形態素情報の中から、前記第一形態素情報を含む前記第二形態素情報を検索することができない場合に、該第一形態素情報と前記各回答内容とを照合し、該各回答内容の中から、該第一形態素情報を含む前記回答内容を検索することができたときは、検索した前記回答内容に関連付けられている前記第二形態素情報を取得するステップと、When the first search means cannot search the second morpheme information including the first morpheme information from the second morpheme information, the first morpheme information and the contents of the answers are obtained. A step of collating and obtaining the second morpheme information associated with the searched answer content when the answer content including the first morpheme information can be searched from the answer contents When,
を有する処理を実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。A computer-readable recording medium having recorded thereon a program for executing a process including:
利用者から入力された入力情報に基づいて、該入力情報を示す文字列を特定する文字認識手段と、Character recognition means for identifying a character string indicating the input information based on the input information input by the user;
前記文字認識手段で特定された前記文字列に基づいて、該文字列の最小単位を構成する各形態素を第一形態素情報として抽出する形態素抽出手段と、  Based on the character string specified by the character recognition means, morpheme extraction means for extracting each morpheme constituting the minimum unit of the character string as first morpheme information;
前記利用者からの前記入力情報に対して定型的な内容を回答するための定型内容  Standard content for answering standard content to the input information from the user を予め複数記憶する定型記憶手段と、Fixed form storage means for storing a plurality of
前記形態素抽出手段で抽出された前記第一形態素情報と前記各定型内容とを照合し、該各定型内容の中から、該第一形態素情報を含む前記定型内容を取得する定型取得手段と、  A fixed form acquisition means for collating the first morpheme information extracted by the morpheme extraction means with the fixed form contents, and acquiring the fixed form contents including the first morpheme information from the fixed form contents;
回答取得手段で取得された過去の回答内容の履歴を記憶する履歴記憶手段と、History storage means for storing a history of past answer contents acquired by the answer acquisition means;
前記利用者から入力された前記入力情報に合意するための合意内容を予め記憶する合意記憶手段とを有し、  An agreement storage means for preliminarily storing agreement content for agreeing on the input information input from the user;
前記定型取得手段は、前記形態素抽出手段で取得された現在の前記第一形態素情報と過去の前記回答内容とを照合し、現在の該第一形態素情報が過去の該回答内容に含まれる場合には、前記合意内容を取得する  The fixed form acquisition unit collates the current first morpheme information acquired by the morpheme extraction unit with the past response content, and the current first morpheme information is included in the past response content. Get the agreement content
ことを特徴とする会話制御装置。A conversation control device characterized by that.
利用者から入力された入力情報に基づいて、該入力情報を示す文字列を特定する文字認識手段と、Character recognition means for identifying a character string indicating the input information based on the input information input by the user;
前記文字認識手段で特定された前記文字列に基づいて、該文字列の最小単位を構成する各形態素を第一形態素情報として抽出する形態素抽出手段と、  Based on the character string specified by the character recognition means, morpheme extraction means for extracting each morpheme constituting the minimum unit of the character string as first morpheme information;
前記利用者からの前記入力情報に対して定型的な内容を回答するための定型内容を予め複数記憶する定型記憶手段と、  Fixed form storage means for previously storing a plurality of fixed contents for answering fixed contents in response to the input information from the user;
前記形態素抽出手段で抽出された前記第一形態素情報と前記各定型内容とを照合し、該各定型内容の中から、該第一形態素情報を含む前記定型内容を取得する定型取得手段とを有し、  The first morpheme information extracted by the morpheme extraction unit is collated with each fixed content, and the fixed form acquisition unit is provided for acquiring the fixed content including the first morpheme information from the fixed content. And
前記履歴記憶手段には、前記定型取得手段で取得された過去の前記第一形態素情報が記憶され、The history storage means stores the past first morpheme information acquired by the fixed form acquisition means,
前記利用者に対して反発するための反発内容を予め記憶する反発記憶手段を有し、  Repulsion storage means for preliminarily storing repulsion contents for repulsion against the user;
前記定型取得手段は、前記形態素抽出手段で取得された現在の前記第一形態素情報と過去の前記第一形態素情報とを照合し、現在の該第一形態素情報が過去の該第一形態素情報に含まれる場合には、前記反発内容を取得する  The fixed form acquisition unit collates the current first morpheme information acquired by the morpheme extraction unit with the past first morpheme information, and the current first morpheme information is converted into the past first morpheme information. If included, get the repulsion content
ことを特徴とする会話制御装置。A conversation control device characterized by that.
利用者から入力されるであろう入力情報又は利用者への回答内容に関連性のある形態素を示す談話範囲には、一つの文字、複数の文字列又はこれらの組み合わせからなる前記形態素を示す第二形態素情報が複数関連付けられ、前記各第二形態素情報には、前記利用者への前記回答内容がそれぞれに関連付けてられており、該談話範囲を予め複数記憶する談話記憶手段と、The discourse range indicating the morpheme related to the input information that will be input by the user or the response content to the user includes the first morpheme that includes one character, a plurality of character strings, or a combination thereof. A plurality of dimorpheme information is associated with each of the second morpheme information, the content of the answer to the user is associated with each, a discourse storage means for storing a plurality of discourse ranges in advance,
前記形態素抽出手段で抽出された前記第一形態素情報と前記各談話範囲とを照合し、該各談話範囲の中から、該第一形態素情報を含む前記談話範囲を検索する談話検索手段と、  A discourse search means for collating the first morpheme information extracted by the morpheme extraction means and the discourse ranges, and searching the discourse range including the first morpheme information from the discourse ranges;
前記談話検索手段で検索された前記談話範囲に関連付けられている前記各第二形態素情報と、前記形態素抽出手段で抽出された前記第一形態素情報とを照合し、該各第二形態素情報の中から、該第一形態素情報を含む前記第二形態素情報を検索する第一検索手段と、  The second morpheme information associated with the discourse range searched by the discourse search means is collated with the first morpheme information extracted by the morpheme extraction means, From the first search means for searching the second morpheme information including the first morpheme information,
前記第一検索手段で検索された前記第二形態素情報に基づいて、該第二形態素情報に関連付けられた前記回答内容を取得する回答取得手段と、  Based on the second morpheme information searched by the first search unit, an answer acquisition unit that acquires the response content associated with the second morpheme information;
前記第一検索手段で検索された前記第二形態素情報に基づいて、該第二形態素情報と前記談話検索手段で検索された前記談話範囲とを照合し、該第二形態素情報を構成する各形態素の中から、該談話範囲と一致する前記形態素を削除する削除手段と、Based on the second morpheme information searched by the first search means, the second morpheme information is collated with the discourse range searched by the discourse search means, and each morpheme constituting the second morpheme information Deleting means for deleting the morpheme that matches the discourse range from
前記削除手段で前記形態素が削除された前記第二形態素情報に基づいて、前記談話検索手段で検索された前記談話範囲に関連付けられた他の談話範囲を取得し、取得した前記他の談話範囲を構成する前記形態素を、該第二形態素情報に付加する談話付加手段とを有し、  Based on the second morpheme information from which the morpheme has been deleted by the deleting unit, obtain another discourse range associated with the discourse range searched by the discourse search unit, and obtain the acquired other discourse range A discourse adding means for adding the morpheme to the second morpheme information;
前記回答取得手段は、前記談話付加手段で前記形態素が付加された前記第二形態  The answer acquisition means is the second form in which the morpheme is added by the discourse addition means. 素情報に基づいて、該第二形態素情報に関連付けられた前記回答内容を取得するBased on the elementary information, obtains the answer content associated with the second morpheme information
ことを特徴とする会話制御装置。A conversation control device characterized by that.
利用者から入力されるであろう入力情報又は利用者への回答内容に関連性のある形態素を示す談話範囲には、一つの文字、複数の文字列又はこれらの組み合わせからなる前記形態素を示す第二形態素情報が複数関連付けられ、前記各第二形態素情報には、前記利用者への前記回答内容がそれぞれに関連付けてられており、該談話範囲を予め複数記憶する談話記憶手段と、The discourse range indicating the morpheme related to the input information that will be input by the user or the response content to the user includes the first morpheme that includes one character, a plurality of character strings, or a combination thereof. A plurality of dimorphic information is associated with each of the second morpheme information, the content of the answer to the user is associated with each, a discourse storage means for storing a plurality of discourse ranges in advance,
前記形態素抽出手段で抽出された前記第一形態素情報と前記各談話範囲とを照合し、該各談話範囲の中から、該第一形態素情報を含む前記談話範囲を検索する談話検索手段と、  A discourse search means for collating the first morpheme information extracted by the morpheme extraction means and the discourse ranges, and searching the discourse range including the first morpheme information from the discourse ranges;
前記談話検索手段で検索された前記談話範囲に関連付けられている前記各第二形態素情報と、前記形態素抽出手段で抽出された前記第一形態素情報とを照合し、該各第二形態素情報の中から、該第一形態素情報を含む前記第二形態素情報を検索する第一検索手段と、  The second morpheme information associated with the discourse range searched by the discourse search means is collated with the first morpheme information extracted by the morpheme extraction means, From the first search means for searching the second morpheme information including the first morpheme information,
前記第一検索手段で検索された前記第二形態素情報に基づいて、該第二形態素情報に関連付けられた前記回答内容を取得する回答取得手段と、  Based on the second morpheme information searched by the first search unit, an answer acquisition unit that acquires the response content associated with the second morpheme information;
前記第一検索手段は、前記各第二形態素情報の中から、前記第一形態素情報を含む前記第二形態素情報を検索することができない場合に、該第一形態素情報と前記各回答内容とを照合し、該各回答内容の中から、該第一形態素情報を含む前記回答内容を検索することができたときは、検索した前記回答内容に関連付けられている前記第二形態素情報を取得するThe first search means, when the second morpheme information including the first morpheme information cannot be searched from the respective second morpheme information, When the response content including the first morpheme information can be searched from the response content, the second morpheme information associated with the searched response content is acquired.
ことを特徴とする会話制御装置。A conversation control device characterized by that.
JP2002126732A 2002-04-11 2002-04-26 Conversation control system, conversation control device, conversation control method, program, and recording medium recording program Expired - Fee Related JP3927067B2 (en)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP2002126732A JP3927067B2 (en) 2002-04-26 2002-04-26 Conversation control system, conversation control device, conversation control method, program, and recording medium recording program
PCT/JP2003/004563 WO2003085550A1 (en) 2002-04-11 2003-04-10 Conversation control system and conversation control method
US10/511,236 US8126713B2 (en) 2002-04-11 2003-04-10 Conversation control system and conversation control method
EP03745994A EP1494129A4 (en) 2002-04-11 2003-04-10 Conversation control system and conversation control method
CN03808195.4A CN100583086C (en) 2002-04-11 2003-04-10 Conversation control system and conversation control method
AU2003236049A AU2003236049B2 (en) 2002-04-11 2003-04-10 Conversation control system and conversation control method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002126732A JP3927067B2 (en) 2002-04-26 2002-04-26 Conversation control system, conversation control device, conversation control method, program, and recording medium recording program

Publications (2)

Publication Number Publication Date
JP2003316781A JP2003316781A (en) 2003-11-07
JP3927067B2 true JP3927067B2 (en) 2007-06-06

Family

ID=29541064

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002126732A Expired - Fee Related JP3927067B2 (en) 2002-04-11 2002-04-26 Conversation control system, conversation control device, conversation control method, program, and recording medium recording program

Country Status (1)

Country Link
JP (1) JP3927067B2 (en)

Also Published As

Publication number Publication date
JP2003316781A (en) 2003-11-07

Similar Documents

Publication Publication Date Title
JP3997105B2 (en) Conversation control system, conversation control device
JP4279883B2 (en) Conversation control system, conversation control method, program, and recording medium recording program
JP4110012B2 (en) Conversation control device and conversation control method
JP2004258902A (en) Conversation controller, and conversation control method
JP4110011B2 (en) Conversation control device and conversation control method
JP4413486B2 (en) Home appliance control device, home appliance control method and program
JP3927067B2 (en) Conversation control system, conversation control device, conversation control method, program, and recording medium recording program
JP4913850B2 (en) Information processing system and information processing method
JP4751563B2 (en) Product discharge device, product discharge control method and program
JP4205370B2 (en) Conversation control system, conversation control method and program
JP4109964B2 (en) Information output device, information output method, and program
JP3923378B2 (en) Robot control apparatus, robot control method and program
JP4402868B2 (en) Information acquisition apparatus, information acquisition method, and program
JP4274760B2 (en) Map output device, map output method and program
JP4038399B2 (en) Face image display device, face image display method and program
JP4253487B2 (en) Information acquisition device
JP4434553B2 (en) Information processing system, information processing apparatus, information processing method, program, and recording medium recording the program
JP4116367B2 (en) Conversation control system, conversation control method, program
JP4188622B2 (en) Access system and access control method
JP3947421B2 (en) Conversation control system, conversation control method, program, and recording medium recording program
JP4316839B2 (en) Conversation control device and conversation control method
JP4312443B2 (en) Information notification system, information notification control method and program
JP2004062685A (en) Information processing system, information processing method and program
JP2004030323A (en) System and method for information transmission, and program
JP4832701B2 (en) Game machine, game control method, control program

Legal Events

Date Code Title Description
A625 Written request for application examination (by other person)

Free format text: JAPANESE INTERMEDIATE CODE: A625

Effective date: 20050119

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061205

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070118

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070213

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070301

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 3927067

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100309

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110309

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110309

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120309

Year of fee payment: 5

S631 Written request for registration of reclamation of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313631

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120309

Year of fee payment: 5

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120309

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120309

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130309

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130309

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140309

Year of fee payment: 7

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees