JP4461738B2 - Question answering apparatus and method - Google Patents
Question answering apparatus and method Download PDFInfo
- Publication number
- JP4461738B2 JP4461738B2 JP2003292777A JP2003292777A JP4461738B2 JP 4461738 B2 JP4461738 B2 JP 4461738B2 JP 2003292777 A JP2003292777 A JP 2003292777A JP 2003292777 A JP2003292777 A JP 2003292777A JP 4461738 B2 JP4461738 B2 JP 4461738B2
- Authority
- JP
- Japan
- Prior art keywords
- message
- question
- response
- response message
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
本発明は入力された質問に対する回答を含むテキストを出力する質問応答技術に関する。 The present invention relates to a question answering technique for outputting a text including an answer to an inputted question.
掲示板やメーリングリストは、何らかの共通の目的が設定されており、その目的に関連した質問をしてその回答を得るといった使われ方をすることが多い。例えば、社内である製品を担当しているSEが、顧客への製品の設置におけるトラブルや、顧客からの問い合わせの内容などに関して質問したり、それらの結果を共有したりする目的で、掲示板やメーリングリストを運用する場合がある。このような掲示板やメーリングリストのメッセージの蓄積には、これまでに発生した様々なトラブルへの対処方法に関する質問や、顧客からの問い合わせへの対応に関する質問と、それらに対する回答が含まれている。顧客は異なるが同じ製品を担当しているSE(システムエンジニア)や、類似した製品を担当しているSEの場合、似たようなトラブルが発生することは多い。しかし、その都度新たに質問をしても、過去にしたのと同じような回答を何度もするのは面倒であるため、経験者や知見をもっている人から適切な回答を得られないことが多い。過去のメッセージから同じ質問や類似する質問とその回答を適切に探し出すことができれば、過去の蓄積を利用して問題を解決したり、異なる点だけを質問することにより、回答者に手間をかけさせずに回答を得たり、また回答を知っていそうな適切な人を探し出したりすることができる。しかしながら、過去のメッセージすべてに目を通して質問を探すのには膨大な手間を要する。またその製品では発生したことのないトラブルであっても、機能や動作環境が類似した他の製品で同様のトラブルが発生していることもあり得るが、そのような場合、自分がふだん関わっていない他製品に関するこれまでのメッセージから類似する質問を探し出すことはさらに膨大な手間を要する。 Bulletin boards and mailing lists have some common purpose, and are often used by asking questions related to that purpose and obtaining answers. For example, a bulletin board or mailing list is used for the purpose of an SE in charge of a product in the company to ask questions regarding the installation of products to customers, the contents of inquiries from customers, and to share the results. May be used. The accumulation of messages on such bulletin boards and mailing lists includes questions on how to deal with various troubles that have occurred so far, questions on how to respond to inquiries from customers, and answers to them. In the case of an SE (system engineer) who is in charge of the same product but with a different customer or an SE in charge of a similar product, similar troubles often occur. However, even if a new question is asked each time, it is cumbersome to repeatedly give the same answer as in the past, so it may not be possible to obtain an appropriate answer from experienced people or people with knowledge. Many. If you can find the same or similar questions and answers from past messages appropriately, you can use the past accumulation to solve the problem or ask only the different points to make the respondents take time. Without getting answers, and finding the right person who seems to know the answers. However, it takes a lot of work to look through all past messages and search for questions. In addition, even if a trouble has never occurred in that product, it is possible that another product with a similar function or operating environment might have the same trouble. In such a case, you are usually involved. Finding similar questions from previous messages about other products that don't have much more work.
メッセージの蓄積を整理して、問題とそれに対する対策を記述した定型的なデータが作成されている場合には、そこから適切な対策を検索する方法が提案されている(特許文献1)。しかしながら、大量のメッセージを人手で整理して、よくある問題を抽出したり、似たような問題をまとめたりするのは困難な作業であり、膨大な手間を要する。FAQリストの自動作成も試みられているが、現状では実用上十分な精度での抽出は困難である。また、上述のような製品トラブルなどの場合、製品の発売時など、短期間に似たような問題が集中することもあり、時間をかけて問題データベースなどを作っていては間に合わないことも多い。 A method has been proposed in which message accumulation is organized, and when typical data describing problems and countermeasures for them is created, an appropriate countermeasure is searched from there (Patent Document 1). However, it is difficult to manually organize a large number of messages, extract common problems, and collect similar problems. Although automatic creation of an FAQ list has been attempted, it is difficult to extract with sufficient accuracy in practice at present. Also, in the case of product troubles such as those mentioned above, similar problems may be concentrated in a short period of time, such as when a product is released, and it is often not possible to make a problem database etc. over time. .
一方、掲示板システムやメイルシステムに検索機能を設け、キーワード検索などの一般的なテキスト検索技術を使ったメッセージの検索が実現されている。このような方法では、各メッセージを対等なひとつのテキストとみなして検索するため、質問や回答ではないメッセージや、質問や回答とは関係ない部分がキーワードとマッチしても検索されてしまう。 On the other hand, a search function is provided in a bulletin board system or a mail system, and a message search using a general text search technique such as a keyword search is realized. In such a method, each message is searched as one equivalent text, so that a message that is not a question or an answer or a part that is not related to a question or an answer matches a keyword.
また、ユーザが入力した質問に対して、大量の文書の中から回答を探して出力する質問応答システムが提案されている(特許文献2)。このようなシステムにメッセージを登録した場合も、質問メッセージであるとか回答メッセージであるとかに関係なく、質問文と似た文を含むテキストが検索され、その中から回答が抽出される。また、現状の質問応答システムは、「何」、「誰」、「いつ」などのように、短い名詞句で答えることが可能であり、かつ回答がはっきりしているものを対象としている。一方で、上述したようなトラブルや問い合わせへの対応の場合、「どのように」、「なぜ」といった一言では答えられない手順や方法に関する質問が多いため、質問応答システムによって答えを得ることは困難である。 Also, a question answering system that searches for and outputs answers from a large number of documents in response to a question input by a user has been proposed (Patent Document 2). Even when a message is registered in such a system, regardless of whether the message is a question message or an answer message, text including a sentence similar to the question sentence is searched, and the answer is extracted from the retrieved text. In addition, the current question answering system is intended for those that can answer with a short noun phrase, such as “what”, “who”, “when”, etc. and have a clear answer. On the other hand, in the case of dealing with troubles and inquiries as described above, there are many questions about procedures and methods that cannot be answered with a single word such as `` how '' and `` why ''. Have difficulty.
さらに、このような質問の場合、例えば動作するOS(オペレーティングシステム)や一緒に使われる他の製品といった様々な顧客の環境によって回答が異なることが多く、それらの条件が異なれば全く参考にならなかったり、条件の異なる大量のメッセージが検索され、すべて読まなければ適切なメッセージを探し出せなかったりする。ところが、人間が検索システムや質問応答システムに質問を入力する場合、最初は簡単な質問文を入れ、詳しい情報まで入力しない傾向がある。またどのような条件が問題に関連しているかを質問者がわかっていない状況では、環境や背景などの情報を入力するのは困難である。したがって、関連文書検索などの詳細な検索を行って、質問文と似た内容をもつメッセージを検索しても、元の質問文に必要な情報が十分に含まれていないため、適切なメッセージが検索されなかったり、大量のメッセージが検索されてしまったりして、ユーザが適切な回答を得ることは容易ではない。
本発明はこのような点に鑑みてなされたものであり、本発明の目的の1つは、ユーザの曖昧な質問に対して適切なヒント情報を与えることにより、組織化されていない大量のメッセージテキストの中から、ユーザの意図に合った質問メッセージとその応答メッセージを探し出して提示し得る質問応答技術を提供することである。 The present invention has been made in view of these points, and one of the objects of the present invention is to provide a large amount of unorganized messages by providing appropriate hint information to a user's ambiguous question. It is to provide a question answering technique capable of finding and presenting a question message and a response message suitable for the user's intention from the text.
本発明の一側面よれば、上記課題を解決するために、図1の具体例を参照しつつ説明すれば、質問応答装置に:テキストで表されたメッセージと、メッセージ情報に対する応答メッセージとを関連づけて登録したメッセージデータベース1と;ユーザが質問文を入力する質問文入力手段2と;メッセージデータベース中のメッセージおよび質問文入力手段から入力された入力質問文を解析するテキスト解析手段3と;メッセージデータベース1中のメッセージから、質問を表す文を含むメッセージを抽出する質問メッセージ抽出手段5と;質問メッセージ抽出手段で抽出された質問メッセージの中から入力質問文に類似する一つ以上のメッセージを検索する類似質問メッセージ検索手段8と;類似質問メッセージ検索手段で検索された類似質問メッセージと類似質問メッセージの応答メッセージから、入力質問文に含まれる語句と含まれない語句との間の係り受け関係を抽出するヒント情報抽出手段10と;ヒント情報抽出手段で抽出された係り受け関係を表示し、ユーザの意図に合う関係およびユーザの意図に合わない関係の少なくとも一方の指示を受け付けるヒント情報フィードバック手段11と;ヒント情報フィードバック手段により受け付けた指示に基づいて、応答メッセージをスコアリングする応答メッセージスコアリング手段12と;応答メッセージスコアリング手段のスコアリング結果に基づいて、応答メッセージを出力する応答メッセージ出力手段13とを設けるようにしている。 According to one aspect of the present invention, in order to solve the above problem, referring to the specific example of FIG. 1, the question answering apparatus associates a message expressed in text with a response message for message information. A message database 1 registered by the user; a question sentence input means 2 for a user to input a question sentence; a text analysis means 3 for analyzing a message in the message database and an input question sentence input from the question sentence input means; and a message database Question message extracting means 5 for extracting a message including a sentence representing a question from the message in 1; Searching for one or more messages similar to the input question sentence from the question messages extracted by the question message extracting means Similar question message search means 8; similarities searched by similar question message search means Hint information extracting means 10 for extracting a dependency relation between a phrase included in the input question sentence and a phrase not included from the response message of the message and the similar question message; and a dependency relation extracted by the hint information extraction means And the hint information feedback means 11 for receiving at least one instruction of a relationship that matches the user's intention and a relationship that does not match the user's intention; and scoring the response message based on the instruction received by the hint information feedback means Response message scoring means 12; and response message output means 13 for outputting a response message based on the scoring result of the response message scoring means are provided.
この構成においては、すでに取得していた質問メッセージ群から、入力質問文に類似する質問メッセージを検出し、これに対応する応答メッセージを取り出し、スコア付けするので、適切な応答メッセージを過去のメッセージから絞り込むことができる。 In this configuration, since the question message similar to the input question sentence is detected from the already obtained question message group, and the corresponding response message is extracted and scored, an appropriate response message is extracted from the past message. You can narrow down.
入力質問文に含まれる語句と含まれない語句の係り受け関係に着目してユーザにヒント情報を提供することができる。過去の質問メッセージや応答メッセージは、入力質問文と若干異なる環境に対応するものが多く、入力質問文に含まれない語句の係り受け関係も考慮することにより、例えばユーザの意図に合致したおメッセージの抽出が可能となる。 It is possible to provide hint information to the user by paying attention to the dependency relationship between words included in the input question sentence and words not included. Many past question messages and response messages correspond to environments that are slightly different from the input question text. Considering the dependency relationship of words not included in the input question text, for example, messages that match the user's intention Can be extracted.
なお、場合によっては、既存の質問メッセージや応答メッセージの一方のみの語句の係関係をヒント情報としても良い。入力質問文に含まれる語句の間の係り受け関係をヒント情報に加えても良い。 In some cases, the relationship between words of only one of the existing question message and response message may be used as hint information. A dependency relationship between words included in the input question sentence may be added to the hint information.
また、検索して得た質問メッセージに対応する応答メッセージを文法情報や知識情報を用いてスコア付けしたりしてもよい。 Moreover, you may score the response message corresponding to the question message obtained by searching using grammatical information or knowledge information.
用いるメッセージデータベースは、例えば、電子掲示板やメーリングリストであるが、これに限定されない。メッセージに対する応答メッセージの関連づけがなされていればよい。もちろん、質問や、これに対する応答以外のメッセージが含まれていても良い。関連づけは識別可能なものであればどのようなものでもよい。スレッドを表すインデントであってもい。メッセージデータベースはメッセージを記憶保持する手段であり、「メッセージデータベース」の語句に限定されるものではなく、その他の語句を用いて特定することもある。 The message database used is, for example, an electronic bulletin board or a mailing list, but is not limited thereto. It is sufficient that the response message is associated with the message. Of course, a message other than a question or a response to the question may be included. The association may be anything that can be identified. It can be an indentation representing a thread. The message database is a means for storing and holding messages, and is not limited to the phrase “message database”, but may be specified using other phrases.
過去の質問メッセージは、予め抽出されていることが好ましいが、何らかのラベルを付してメッセージデータベースから簡易に取り出せるようにしておいても良い。類似質問メッセージを検索する時点で、質問メッセージ自体の抽出を行うようにしても良い。 The past question messages are preferably extracted in advance, but some labels may be attached so that they can be easily retrieved from the message database. At the time of searching for similar question messages, the question messages themselves may be extracted.
また、本発明の他の側面によれば、質問応答装置に:テキストで表されたメッセージと、前記メッセージに対する応答メッセージとを関連づけて登録したメッセージデータベースと;ユーザが質問文を入力する質問文入力手段と;前記メッセージデータベース中のメッセージから、質問を表す文を含むメッセージとして抽出された質問メッセージの中から、前記入力質問文に類似する一つ以上のメッセージを検索する類似質問メッセージ検索手段と;前記類似質問メッセージ検索手段で検索された類似質問メッセージに関連づけられた応答メッセージをスコア付けする手段と;上記スコアに基づいて応答メッセージを出力する応答メッセージ出力手段とを設けるようにしている。 According to another aspect of the present invention, a question answering apparatus: a message database in which a message expressed in text and a response message corresponding to the message are registered in association with each other; a question sentence input for a user to input a question sentence A similar question message search means for searching for one or more messages similar to the input question sentence from question messages extracted as messages including a sentence representing a question from the messages in the message database; Means for scoring a response message associated with the similar question message searched by the similar question message search means; and response message output means for outputting a response message based on the score are provided.
この構成においても、すでに取得していた質問メッセージ群から、入力質問文に類似する質問メッセージを検出し、これに対応する応答メッセージを取り出し、スコア付けするので、適切な応答メッセージを過去のメッセージから絞り込むことができる。 Even in this configuration, since the question message similar to the input question sentence is detected from the already obtained question message group, and the response message corresponding to this is extracted and scored, the appropriate response message is determined from the past message. You can narrow down.
なお、この発明は装置またはシステムとして実現できるのみでなく、方法としても実現可能である。また、そのような発明の一部をソフトウェアとして構成することができることはもちろんである。またそのようなソフトウェアをコンピュータに実行させるために用いるソフトウェア製品もこの発明の技術的な範囲に含まれることも当然である。 The present invention can be realized not only as an apparatus or a system but also as a method. Of course, a part of the invention can be configured as software. Of course, software products used to cause a computer to execute such software are also included in the technical scope of the present invention.
この発明の上述の側面および他の側面は特許請求の範囲に記載され以下実施例を用いて詳述される。 These and other aspects of the invention are set forth in the appended claims and will be described in detail below with reference to examples.
この発明によれば、メッセージデータベースに蓄えておいた質問メッセージに着目して入力質問文に適合する応答メッセージを適切に絞り込むことができる。とくにユーザの曖昧な質問に対して適切なヒント情報を与えれば、組織化されていない大量のメッセージテキストの中から、ユーザの意図に合った質問メッセージとその応答メッセージを探し出して提示することができる。 According to this invention, it is possible to appropriately narrow down the response messages that match the input question text by focusing on the question messages stored in the message database. In particular, if appropriate hint information is given to a user's ambiguous question, it is possible to search and present a question message and its response message that suit the user's intention from a large amount of unorganized message text. .
以下、本発明の実施例を、図面を参照して詳細に説明する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
図1は、本発明の実施の形態に係る質問応答システムの構成を示す。図1において、質問応答システムは、メッセージデータベース1、質問文入力部2、テキスト解析部3、メッセージ解析結果データベース4、質問メッセージ抽出部5、検索用インデックス作成部6、検索用インデックス保持部7、類似質問メッセージ検索部8、応答メッセージ抽出部9、ヒント情報抽出部10、ヒント情報フィードバック部11、応答メッセージスコアリング部12、応答メッセージ出力部13等を含んで構成されている。
FIG. 1 shows a configuration of a question answering system according to an embodiment of the present invention. 1, the question answering system includes a message database 1, a question
メッセージデータベース1には、ひとつ以上のメッセージ群が記録されている。各メッセージ群は、ひとつのメーリングリストや掲示板等のメッセージ群であり、テキストから成る複数のメッセージと、メッセージ間の応答関係により構成されている。メッセージ間の応答関係とは、あるメッセージがどのメッセージの返信メッセージであるとか、あるメッセージの返信メッセージはどのメッセージかといった関係を示すものである。 In the message database 1, one or more message groups are recorded. Each message group is a message group such as one mailing list or bulletin board, and is composed of a plurality of messages composed of text and response relationships between the messages. The response relationship between messages indicates the relationship of which message is a reply message of a message and which message is a reply message of a message.
質問文入力部2は、ユーザからの質問文の入力を受け付ける。
The question
テキスト解析部3は、メッセージデータベース1中の各メッセージおよびユーザからの入力質問文をテキスト解析する。テキスト解析部3は、まず入力テキストを形態素解析し、単語に分割して品詞情報を付与する。さらに、必要に応じて単語間の係り受け関係を解析する。係り受け解析は、種々の手法を採用でき、例えば、構文解析による方法でも、パターンマッチング等による浅い解析による方法でもよい。テキスト解析部3で解析された各メッセージの解析結果は、メッセージ解析結果データベース4に登録される。
The
質問メッセージ抽出部5は、テキスト解析部3の解析結果から、各メッセージが質問文を含むかどうかを判断し、質問文を含むメッセージを抽出する。質問文を含むかどうかは、例えば、メッセージ中の各文の形態素解析結果から、ルールに基づいて判断する。このルールは、「文末が助詞「か」である」、「文末が助詞「ね」+疑問符である」、「疑問詞を含み、文末が「か」である」などであるが、これに限定されない。例えば、形態素解析結果だけでなく、係り受け解析結果を利用するようなルールを用いてもよい。
The question
検索用インデックス作成部6は、質問メッセージ抽出部5で質問文を含むと判断されたメッセージの解析結果から、質問メッセージ検索用のインデックスを作成し、検索用インデックス保持部7に登録する。検索用インデックス保持部7には、例えば、質問メッセージ中の自立語とその頻度が登録される。検索用インデックスはこれに限らず、類似質問メッセージ検索部8で利用する検索方式に応じて、どのような方式であってもよい。また、質問メッセージ全体ではなく、質問文と判断された文のみをインデックス作成の対象としてもよい。
The search index creation unit 6 creates a question message search index from the analysis result of the message determined to contain the question sentence by the question
類似質問メッセージ検索部8は、テキスト解析部3で解析された入力質問文の解析結果から、検索用インデックス保持部7を検索し、類似する質問文を含むメッセージを抽出する。検索方法は、例えば、入力質問文から自立語を抽出し、各質問メッセージをこれらの自立語の出現頻度やtf*IDF(Term Frequency/Inverse Document Frequency)などで重み付けしてスコアリングし、スコアの高いメッセージを類似メッセージとして抽出する。検索方法はこれに限らず、入力質問文から特定の品詞の単語のみを抽出したり、入力質問文に含まれる単語間の関係を用いたりしてもよい。抽出される類似質問メッセージの数は、あらかじめ設定しておいたり、ユーザ設定画面などで事前に設定できるようにしたり、あるいは質問入力時に指定するようにしてもよい。
The similar question
応答メッセージ抽出部9は、メッセージデータベース1に記録されたメッセージ間の応答関係から、類似質問メッセージ検索部8で抽出された各類似質問メッセージの返信メッセージを抽出する。応答メッセージの抽出は、類似質問メッセージの直接の返信メッセージのみを抽出する方法、返信の返信など、間接的な返信メッセージを含めメッセージ単位で抽出する方法、直接の返信メッセージ以下の返信メッセージ群を一単位として抽出する方法など種々の方法が考えられ、どの方法を用いてもよい。
The response message extraction unit 9 extracts the reply message of each similar question message extracted by the similar question
ヒント情報抽出部10は、応答メッセージ抽出部9で抽出された各応答メッセージの解析結果等からユーザに提示するヒント情報を作成する。ヒント情報抽出部10はまず、各応答メッセージの解析結果をメッセージ解析結果データベース4から読み出す。次に、入力質問文に含まれる語と含まれない語との間の係り受け関係を抽出する。ここで入力質問文に含まれる語としては、入力質問文の解析結果のうち、あらかじめ定めた条件に適合するもの、例えば自立語すべて、あるいは、名詞と動詞と形容詞と形容動詞といった一定の品詞の語などを選択する。入力質問文中の単語を例えばtf*IDFなどによってスコアリングし、スコアの高い語を選んでもよい。応答メッセージに含まれる語のうちの質問文に含まれない語も同様に、自立語全部、あるいは一定の品詞の語、スコアの高い語などを選択する。また、入力質問文に含まれる語と含まれない語との間の係り受け関係は、すべての係り受け関係を選択してもいいし、あらかじめ重要と定めた関係、例えば名詞と動詞の格関係などに限定してもよい。さらに単語と係り受け関係の重要度を定め、各係り受け関係のスコアを計算して、一定数のスコアの高いものをヒント情報として抽出するようにしてもよい。入力質問文に含まれる語が単独で他の語と係り受け関係をもつ場合だけでなく、入力質問文に含まれる語を含む複合語の係り受け関係も抽出するようにしてもよい。
The hint
ヒント情報フィードバック部11は、ヒント情報抽出部10で抽出されたヒント情報をユーザに提示し、ユーザの意図に合うント情報と意図に合わないヒント情報を指定させる。意図に合うヒント情報のみ、あるいは意図に合わないヒント情報のみを指定させるようにしてもよい。
The hint
応答メッセージスコアリング部12は、ユーザが指定したヒント情報に基づいて、応答メッセージをスコアリングする。例えば、ユーザが意図に合うと指定したヒント情報にはプラスの重みを、意図に合わないと指定したヒント情報にはマイナスの重みを付け、各応答メッセージが含む係り受け情報に基づいてスコアリングする。ユーザの選択のみによってスコアリングしてもいいし、tf*IDFなどに基づく単語重要度と関係の重要度によって各係り受け関係をスコアリングしたものに対してユーザの選択によって重みを補正し、それらの係り受け関係スコアを例えば加算して応答メッセージのスコアを計算してもよい。また、応答メッセージ中でのヒント情報の出現頻度をスコアリングに加味してもよい。選択されたヒント情報が質問メッセージ中に含まれる場合には、これを応答メッセージのスコアに反映させる。例えば○として選択したヒント情報が含まれる質問メッセージの応答メッセージに加点し、×として選択したヒント情報が含まれる質問メッセージの応答メッセージはスコアを減点する。
The response
応答メッセージ出力部13は、応答メッセージスコアリング部12のスコアリング結果に基づいて、応答メッセージ、あるいは、質問メッセージと応答メッセージのセットをスコアと共に出力する。出力する応答メッセージは、スコアが大きい一定数のものを選んでもよい。ひとつの質問メッセージに複数の応答メッセージがある場合、それらの間の応答関係なども共に出力してもよい。また、各質問メッセージや応答メッセージに含まれる、ユーザが○として選択したヒント情報も共に出力するようにしてもよい。
The response
応答メッセージ表示部14は、応答メッセージ出力部13から出力された応答メッセージを、ディスプレイ等に表示する。表示方法は、スコアの大きい順に応答メッセージまたは質問メッセージと応答メッセージを表示する、メッセージのタイトルのみを表示してリンクにより本文をたどれるようにする、メッセージまたはタイトルをスコアと一緒に表示するなど種々の方法が考えられる。また、同じ質問メッセージの応答メッセージが複数ある場合には、必ずしもスコアの順ではなく、ひとつのスレッド(質問メッセージが同じもの)をまとめて表示するようにしてもよい。さらに、メッセージのタイトルと共に、そのメッセージに含まれるユーザが○として選択したヒント情報を表示してもよい。このようにすることにより、ユーザが本文を読まずに適切な応答メッセージを選択するのを支援することができる。
The response
図2は、本発明の質問応答システムのメッセージ解析結果データベース4の解析結果データと検索用インデックス保持部7のインデックスを作成する際の動作を表すフローチャートである。
FIG. 2 is a flowchart showing the operation when creating the analysis result data of the message analysis result database 4 and the index of the search
図2において、まず、メッセージデータベース1のメッセージがテキスト解析部3に送られ、形態素解析(SP1)および係り受け解析(SP2)される。係り受け解析されたメッセージは、メッセージ解析結果データベース4に例えばメッセージIDと共に登録される(SP3)。一方、形態素解析されたメッセージは質問メッセージ抽出部5に送られ、各メッセージが質問文を含むかどうかを判断する(SP5)。質問文を含むと判断されたメッセージの形態素解析結果は、質問メッセージとして検索用インデックス作成部6に送られる。検索用インデックス作成部6では検索用インデックスが作成され(SP6)、検索用インデックス保持部7に登録される(SP7)。
In FIG. 2, first, a message in the message database 1 is sent to the
図3は、本発明の質問応答システムにユーザが質問を入力した際の動作を示すフローチャートである。 FIG. 3 is a flowchart showing an operation when a user inputs a question to the question answering system of the present invention.
図3において、メッセージデータベース1には、ソフトAのトラブルに関する掲示板に登録された多数のメッセージが登録されており、メッセージ解析結果データベース4の解析結果データおよび検索用インデックス保持部7の検索用インデックスはすでに作成されているものとする。
In FIG. 3, the message database 1 contains a large number of messages registered on the bulletin board related to the trouble of the software A. The analysis result data of the message analysis result database 4 and the search index of the search
まず、ユーザは、質問入力部2に質問を入力する(SP11)。例えば、図4に示す入力質問文Qが入力されたとする。入力質問文Qは、テキスト解析部3で形態素解析され(SP12)、類似質問メッセージ検索部8に送られる。
First, the user inputs a question to the question input unit 2 (SP11). For example, assume that the input question sentence Q shown in FIG. 4 is input. The input question sentence Q is morphologically analyzed by the text analysis unit 3 (SP12) and sent to the similar question
類似質問メッセージ検索部8は、まず入力質問文Qから例えば「ソフトA」、「インストール」、「エラー」、「発生する」をキーワードとして抽出する(SP13)。次に、検索用インデックス保持部7の検索用インデックスからこれらの語を含む質問メッセージを検索し(SP14)、出現頻度等に基づいてランキングし、あらかじめ定めた数、例えば100メッセージを類似質問メッセージとして抽出し(SP15)、応答メッセージ抽出部9に送る。例えば、図5に示す類似質問メッセージQMが類似質問メッセージのひとつとして抽出される。
The similar question
応答メッセージ抽出部9は、メッセージデータベース1から、類似質問メッセージ検索部8で検索された質問メッセージの応答メッセージを抽出し(SP16)、ヒント情報抽出部10に送る。例えば、図6に示すように、QMの応答メッセージAMが応答メッセージのひとつとして抽出される。
The response message extraction unit 9 extracts the response message of the question message searched by the similar question
ヒント情報抽出部10は、まず、類似質問メッセージ検索部8で抽出された類似質問メッセージと、応答メッセージ抽出部9で抽出された応答メッセージの係り受け解析結果を、メッセージ解析結果データベース4から取得する(SP17)。次に、取得した係り受け関係から、入力質問文Qから抽出したキーワード(「ソフトA」、「インストール」、「エラー」、「発生する」)とそれ以外の名詞、動詞、形容詞、形容動詞との係り受け関係を抽出する(SP18)。例えば、類似質問メッセージQMからは図7に示すような係り受け関係が、応答メッセージAMからは図8に示すような係り受け関係が抽出される。図7および図8に示す係り受け関係において、最初の項は関係を表し、自立語間が助詞などでつながっている場合にはその表層表現で、直接係っている場合には係り側と受け側の品詞の組み合わせで示している。二番目の項は係り側の語の表層表現、三番目の項は受け側の語の表層表現である。ヒント情報抽出部10で抽出されたヒント情報は、ヒント情報フィードバック部11に送られる。
First, the hint
ヒント情報フィードバック部11は、ヒント情報抽出部10で抽出されたヒント情報を例えばディスプレイ上に表示し、ユーザに提示する(SP19)。図9(A)は、入力質問文Qに対して提示されるヒント情報の表示例である。図7および図8に示した係り受け関係の例とは異なり、ユーザにわかりやすいように、人間が読める短い句の形で表示している。ユーザは、表示されたヒント情報から、自分の質問の意図に合うもの、合わないものを判断し、フィードバックする(SP20)。図9(B)は、ユーザのフィードバックの例である。○のチェックボックスは意図に合うもの、×のチェックボックスは意図に合わないものを示している。ユーザは、入力質問文には明示しなかった情報のうち、自分の状況に合っていてかつ質問の答えに影響しそうなもの、例えば、「OS−Bにインストール」、「エラーコードはE007」を意図に合う情報として○のチェックボックスにチェックし、自分の状況とは関係のないもの、例えば「OS−Cにインストール」、「エラーコードはE008」などを意図に合わない情報として、×のチェックボックスにチェックする。ユーザのフィードバック情報は、応答メッセージスコアリング部12に送られる。
The hint
応答メッセージスコアリング部12は、ユーザのフィードバック情報に基づいて、応答メッセージ抽出部9で抽出した応答メッセージをスコアリングする(SP21)。ここでは、応答メッセージから抽出された係り受け関係(ヒント情報)の重要度を計算し、ユーザが○として選択した係り受け関係はそのスコアをN倍、×として選択された関係は−N倍し、すべての関係のスコアを加算する。また、質問メッセージにユーザが選択した関係が含まれる場合には、同様にN倍または−N倍したスコアを応答メッセージのスコアに加算する。このようにしてスコアリングされた応答メッセージは、そのスコアと共に応答メッセージ出力部13に送られる。
The response
応答メッセージ出力部13は、応答メッセージスコアリング部12でスコアリングされた応答メッセージをあらかじめ設定した件数だけ、そのスコアと共に出力する(SP22)。
The response
出力された応答メッセージは、応答メッセージ表示部14でディスプレイ上に表示される(SP23)。図10は、表示の一例である。ここでは質問メッセージと応答メッセージのタイトルを、その応答関係がわかるように表示しており、ユーザがメッセージを選択することにより、リンクされた本文を見ることができるようになっている。また、ユーザが○として選択したヒント情報がメッセージに含まれる場合はそれを共に表示している。 The output response message is displayed on the display by the response message display unit 14 (SP23). FIG. 10 is an example of display. Here, the titles of the question message and the response message are displayed so that the response relationship can be understood, and the user can see the linked text by selecting the message. If the message includes hint information selected by the user as ◯, it is displayed together.
本実施の形態においては、メッセージデータベース1のメッセージをあらかじめテキスト解析部3で解析し、質問メッセージ抽出部5で質問メッセージを抽出して、メッセージ解析結果データベース4の解析結果データ、検索用インデックス保持部7の検索用インデックスを作成しておき、質問入力時にはこれらを用いて応答メッセージの抽出を行う構成について述べたが、本発明はこれに限らず、質問入力後にメッセージのテキスト解析および質問文の抽出を行うなど、種々の構成をとることができる。
In the present embodiment, the message in the message database 1 is analyzed in advance by the
以上で実施例の説明を終了する。 This is the end of the description of the embodiment.
なお、この発明は上述の実施例に限定されるものではなくその趣旨を逸脱しない範囲で種々変更が可能である。例えば、上述の例ではヒント情報を用いるようにしたが、文法情報や知識情報や統計情報等で適切な応答メッセージと判断してこれを出力するようにしても良い。ヒント情報と、文法情報や知識情報や統計情報等とを併せて利用しても良い。後者で十分大きなスコア等が得られない等により確定的でないと判断された場合に場合にヒント情報によりユーザの指示を仰ぐようにしても良い。 The present invention is not limited to the above-described embodiments, and various modifications can be made without departing from the spirit of the invention. For example, although the hint information is used in the above-described example, it may be determined that the response message is an appropriate response message based on grammatical information, knowledge information, statistical information, and the like, and output it. Hint information, grammatical information, knowledge information, statistical information, and the like may be used together. In the latter case, when it is determined that the score is not definite because a sufficiently large score or the like cannot be obtained, the user's instruction may be requested by hint information.
1 メッセージデータベース
2 質問文入力部
3 テキスト解析部
4 メッセージ解析結果データベース
5 質問メッセージ抽出部
6 検索用インデックス作成部
7 検索用インデックス保持部
8 類似質問メッセージ検索部
9 応答メッセージ抽出部
10 ヒント情報抽出部
11 ヒント情報フィードバック部
12 応答メッセージスコアリング部
13 応答メッセージ出力部
14 応答メッセージ表示部
DESCRIPTION OF SYMBOLS 1
Claims (4)
ユーザが質問文を入力する質問文入力手段と、
前記メッセージデータベース中の前記応答要求メッセージおよび前記応答メッセージならびに前記質問文入力手段から入力された入力質問文を解析するテキスト解析手段と、
前記メッセージデータベース中の前記応答要求メッセージから、質問を表す文を含む質問メッセージを抽出する質問メッセージ抽出手段と、
前記質問メッセージ抽出手段で抽出された前記質問メッセージの中から、前記入力質問文に類似する一つ以上の類似質問メッセージを検索する類似質問メッセージ検索手段と、
前記類似質問メッセージ検索手段で検索された前記類似質問メッセージと前記類似質問メッセージの応答メッセージから、前記入力質問文に含まれる語句と含まれない語句との間の係り受け関係を抽出するヒント情報抽出手段と、
前記ヒント情報抽出手段で抽出された係り受け関係を表示し、ユーザの意図に合う関係およびユーザの意図に合わない関係の少なくとも一方の指示を受け付けるヒント情報フィードバック手段と、
前記ヒント情報フィードバック手段により受け付けた前記指示に基づいて、前記応答メッセージをスコアリングする応答メッセージスコアリング手段と、
前記応答メッセージスコアリング手段のスコアリング結果に基づいて、前記応答メッセージを出力する応答メッセージ出力手段と
を有することを特徴とする質問応答装置。 A message database in which a response request message expressed in text and a response message corresponding to the response request message are registered in association with each other;
A question sentence input means for the user to input a question sentence;
Text analysis means for analyzing the response request message and the response message in the message database and the input question text input from the question text input means;
From the response request message in the message database, the query message extracting means for extracting a query message containing a statement indicating a question,
From among the question message extracted by the query message extraction unit, a similarity query message retrieval means for retrieving one or more similar query message that is similar to the input question,
From the response message of the similarity query message search means the similarity query message and the similarity query messages retrieved, the hint information extraction for extracting a dependency relationship between the phrase does not include the words contained in the input question Means,
Hint information feedback means for displaying the dependency relationship extracted by the hint information extraction means, and accepting an instruction of at least one of a relationship that matches the user's intention and a relationship that does not match the user's intention;
Based on the instruction accepted by the hint information feedback unit, a response message scoring means for scoring the response message,
And a response message output means for outputting the response message based on a scoring result of the response message scoring means.
ユーザから質問文を入力する質問文入力手段と、
前記メッセージデータベース中の前記応答要求メッセージから抽出された、質問を表す文を含む質問メッセージの中から、前記質問分入力手段により入力された入力質問文に類似する一つ以上の類似質問メッセージを検索する類似質問メッセージ検索手段と、
前記類似質問メッセージ検索手段で検索された前記類似質問メッセージおよび前記類似質問メッセージの応答メッセージの少なくとも一方から、前記入力質問文に含まれる語句に関して語句の間の係り受け関係を抽出するヒント情報抽出手段と、
前記ヒント情報抽出手段で抽出された係り受け関係を表示し、ユーザの意図に合う関係およびユーザの意図に合わない関係の少なくとも一方の指示を受け付けるヒント情報フィードバック手段と、
前記ヒント情報フィードバック手段により受け付けた前記指示に基づいて、前記応答メッセージをスコアリングする応答メッセージスコアリング手段と、
前記応答メッセージスコアリング手段のスコアリング結果に基づいて、前記応答メッセージを出力する応答メッセージ出力手段と
を有することを特徴とする質問応答装置。 A message database in which a response request message expressed in text and a response message corresponding to the response request message are registered in association with each other;
A question sentence input means for inputting a question sentence from a user;
Said message extracted from the response request message in the database, the statement indicating the question from the including questions message, one or more similar query message that is similar to the input question sentence inputted by the question content input means Similar question message search means for searching for,
From at least one of the response message of the retrieved similar inquiry message searching section similar question message and the similar query message, hint information extraction means for extracting a dependency relationship between words with respect to words contained in the input question When,
Hint information feedback means for displaying the dependency relationship extracted by the hint information extraction means, and accepting an instruction of at least one of a relationship that matches the user's intention and a relationship that does not match the user's intention;
Based on the instruction accepted by the hint information feedback unit, a response message scoring means for scoring the response message,
And a response message output means for outputting the response message based on a scoring result of the response message scoring means.
テキストで表された応答要求メッセージと、前記応答要求メッセージに対する応答メッセージとを関連づけて登録したメッセージデータベース、
ユーザが質問文を入力する質問文入力手段、
前記メッセージデータベース中の前記応答要求メッセージおよび前記応答メッセージならびに前記質問文入力手段から入力された入力質問文を解析するテキスト解析手段、
前記メッセージデータベース中の前記応答要求メッセージから、質問を表す文を含む質問メッセージを抽出する質問メッセージ抽出手段、
前記質問メッセージ抽出手段で抽出された前記質問メッセージの中から、前記入力質問文に類似する一つ以上の類似質問メッセージを検索する類似質問メッセージ検索手段、
前記類似質問メッセージ検索手段で検索された前記類似質問メッセージと前記類似質問メッセージの応答メッセージから、前記入力質問文に含まれる語句と含まれない語句との間の係り受け関係を抽出するヒント情報抽出手段、
前記ヒント情報抽出手段で抽出された係り受け関係を表示し、ユーザの意図に合う関係およびユーザの意図に合わない関係の少なくとも一方の指示を受け付けるヒント情報フィードバック手段、
前記ヒント情報フィードバック手段により受け付けた前記指示に基づいて、前記応答メッセージをスコアリングする応答メッセージスコアリング手段、および
前記応答メッセージスコアリング手段のスコアリング結果に基づいて、前記応答メッセージを出力する応答メッセージ出力手段
として機能させる質問応答用コンピュータプログラム。 Computer
A message database in which a response request message expressed in text and a response message for the response request message are associated and registered;
Question sentence input means for the user to input a question sentence,
Text analysis means for analyzing the response request message and the response message in the message database and the input question text input from the question text input means;
A question message extracting means for extracting a question message including a sentence representing a question from the response request message in the message database;
Similar question message search means for searching for one or more similar question messages similar to the input question sentence from the question messages extracted by the question message extraction means,
Hint information extraction for extracting a dependency relationship between a word included in the input question sentence and a word not included from the similar question message searched by the similar question message search means and a response message of the similar question message means,
Hint information feedback means for displaying the dependency relationship extracted by the hint information extraction means and receiving an instruction of at least one of a relationship that matches the user's intention and a relationship that does not match the user's intention;
A response message scoring means for scoring the response message based on the instruction received by the hint information feedback means; and
Response message output means for outputting the response message based on the scoring result of the response message scoring means
Question Answering computer program to function as.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003292777A JP4461738B2 (en) | 2003-08-13 | 2003-08-13 | Question answering apparatus and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003292777A JP4461738B2 (en) | 2003-08-13 | 2003-08-13 | Question answering apparatus and method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005063158A JP2005063158A (en) | 2005-03-10 |
JP4461738B2 true JP4461738B2 (en) | 2010-05-12 |
Family
ID=34369981
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003292777A Expired - Fee Related JP4461738B2 (en) | 2003-08-13 | 2003-08-13 | Question answering apparatus and method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4461738B2 (en) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4860439B2 (en) * | 2006-11-08 | 2012-01-25 | ヤフー株式会社 | Automatic question generation system |
WO2010150910A1 (en) * | 2009-06-26 | 2010-12-29 | 楽天株式会社 | Information search device, information search method, information search program, and storage medium on which information search program has been stored |
JP5664842B2 (en) * | 2010-03-16 | 2015-02-04 | 日本電気株式会社 | Requirements acquisition support method, requirements acquisition support system and program in system development |
JP5323004B2 (en) * | 2010-06-03 | 2013-10-23 | ヤフー株式会社 | Query suggestion apparatus and method based on phrases |
JP6044094B2 (en) * | 2012-03-28 | 2016-12-14 | 富士通株式会社 | Answer support server, answer support system, answer support method, and answer support program |
US10423613B2 (en) | 2013-12-20 | 2019-09-24 | Hitachi, Ltd. | Data search method and data search system |
WO2017175363A1 (en) * | 2016-04-07 | 2017-10-12 | 株式会社アドバンスト・メディア | Information processing system, reception server, information processing method and program |
WO2019235103A1 (en) | 2018-06-07 | 2019-12-12 | 日本電信電話株式会社 | Question generation device, question generation method, and program |
JP7180767B2 (en) | 2019-05-29 | 2022-11-30 | 富士通株式会社 | Response processing program, response processing method, and information processing device |
-
2003
- 2003-08-13 JP JP2003292777A patent/JP4461738B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2005063158A (en) | 2005-03-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6028601A (en) | FAQ link creation between user's questions and answers | |
US6115683A (en) | Automatic essay scoring system using content-based techniques | |
US6044365A (en) | System for indexing and retrieving graphic and sound data | |
US6091415A (en) | System and method for displaying multiple dialog boxes in a window display | |
US20060078862A1 (en) | Answer support system, answer support apparatus, and answer support program | |
US20020002547A1 (en) | Information retrieval apparatus and information retrieval method | |
US20040064305A1 (en) | System, method, and program product for question answering | |
JP3702414B2 (en) | Information search support method, computer-readable storage medium, and information search device | |
US20020120651A1 (en) | Natural language search method and system for electronic books | |
JP2006119991A (en) | Generation device and method and organization device and method for faq data, and faq answer system | |
JP4461738B2 (en) | Question answering apparatus and method | |
JP4613346B2 (en) | Keyword extraction method, keyword extraction program, keyword extraction device, metadata creation method, metadata creation program, and metadata creation device | |
US6640219B2 (en) | Analyzing data files | |
US20090307203A1 (en) | Method of locating content for language learning | |
JP6011180B2 (en) | Facet generation device, facet generation method, and facet generation program | |
JP6653169B2 (en) | Keyword extraction device, content generation system, keyword extraction method, and program | |
US20080300856A1 (en) | System and method for structuring information | |
JP4057962B2 (en) | Question answering apparatus, question answering method and program | |
Lawrence et al. | Surrogate users: mediating between social and technical interaction | |
JP3910823B2 (en) | Questionnaire analysis apparatus, questionnaire analysis method and program | |
JP2001022782A (en) | Method for retrieving/displaying detailed explanation of message having no guide id | |
Baddorf et al. | Finding phrases rather than discovering collocations: Searching corpora for dictionary phrases | |
JP7234077B2 (en) | SEARCH SUPPORT SYSTEM, LEARNING SYSTEM, SEARCH SUPPORT METHOD, AND PROGRAM | |
Nenciu et al. | RASA Conversational Agent in Romanian for Predefined Microworlds. | |
JPH0683870A (en) | Retrieving device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060724 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090825 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091013 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100126 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100208 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130226 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4461738 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130226 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140226 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |