New! View global litigation for patent families

JP2014112316A - Question answering program using large amounts of comment sentences, server and method - Google Patents

Question answering program using large amounts of comment sentences, server and method Download PDF

Info

Publication number
JP2014112316A
JP2014112316A JP2012266589A JP2012266589A JP2014112316A JP 2014112316 A JP2014112316 A JP 2014112316A JP 2012266589 A JP2012266589 A JP 2012266589A JP 2012266589 A JP2012266589 A JP 2012266589A JP 2014112316 A JP2014112316 A JP 2014112316A
Authority
JP
Grant status
Application
Patent type
Prior art keywords
predicate
means
question
argument
answer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012266589A
Other languages
Japanese (ja)
Other versions
JP6007088B2 (en )
Inventor
Kazunori Matsumoto
一則 松本
Hajime Hattori
元 服部
Toshihiro Ono
智弘 小野
Original Assignee
Kddi Corp
Kddi株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date

Links

Abstract

PROBLEM TO BE SOLVED: To provide a question answering server, etc. capable of clearly indicating (narrowing down to) an answer sentence reflecting a user's intention when a plurality of candidates of an answer sentence exist to a user's question sentence.SOLUTION: A question answering server has: question keyword extraction means for extracting a plurality of question keywords from a question sentence; comment sentence retrieval means for retrieving comment sentences including the question keywords; topic classification means for classifying the plurality of retrieved comment sentences into a plurality of topic groups; answer sentence detection means for associating the respective topics with answer sentences whose similarity to the respective answer sentences become a predetermined threshold or more; representative predicate argument structure extraction means for extracting representative predicate argument structures for the respective topics; differential predicate argument structure extraction means for extracting the representative predicate argument structures appearing only in the topics as differential predicate argument structures; differential predicate argument structure selection means for clearly indicating a plurality of differential predicate argument structures to a user to be selected; and answer sentence output means for clearly indicating the answer sentences corresponding to the differential predicate argument structure to the user.

Description

本発明は、質問文の入力に対して最適な回答文を出力する質問回答プログラムの技術に関する。 The present invention relates to a technique question answer program that outputs a best answer sentence to the input of the question.

近年、FAQ(Frequently Asked Questions)に基づく質問回答システムが構築されている。 In recent years, question-and-answer system based on the FAQ (Frequently Asked Questions) have been constructed. 「FAQ」とは、多数の人が共通して頻繁に尋ねる質問に対する回答をまとめた問答集をいう。 The "FAQ", refers to a question-and-answer collection summarizes the answers to frequently asked questions in common a large number of people. 質問回答システムは、特定種類の情報に関する質問文をユーザから自然言語で入力し、その回答文を出力するソフトウェアをいう。 Question Answer system, type in a natural language question about a specific type of information from the user, refers to software that outputs the answer sentence. 一般に、質問回答システムは、仮想質問文とそれに紐づけられた回答候補文とを予めデータベースに記憶する。 In general, the question answer system stores in advance in a database and a virtual question and answer candidate sentence it to the associated string. その上で、質問回答システムは、以下のようなステップで処理を実行する。 On top of that, the question answers system executes the process by the following steps.
(1)ユーザから入力された質問文から、特徴的な単語をクエリとして抽出する。 (1) from the question input by the user, it extracts a characteristic word as a query.
(2)検索エンジンを用いて、複数のクエリの出現頻度が高い仮想質問文を選択する。 (2) using a search engine, the frequency of occurrence of multiple queries to select a high virtual question.
(3)選択された仮想選択文に対する回答文を選択する。 (3) selecting a reply sentence for the selected virtual selected sentence.
(4)選択された回答文をユーザに提示する。 (4) presents the selected answer sentence to the user.

このような質問回答システムは、ユーザに対して単体装置として存在するものもあれば、インターネット上に質問回答サーバとして接続されたものものある。 Such question answering systems, some are present as a single device to the user, also those connected as question answering server on the Internet. この質問回答サーバは、ユーザ操作の端末からネットワークを介して質問文を受信し、回答文をその端末へ送信する(例えば非特許文献1参照)。 The question answering server via a network from a terminal of the user operation received the question message, and transmits the answer message to the terminal (for example, see Non-Patent Document 1).

また、他の技術として、インターネット上に、ブログ(Web log)サーバやミニブログ(mini Web log)(例えばtwitter(登録商標))サーバが接続されている。 Further, as another technology, on the Internet, blogs (Web log) server and mini blogs (mini Web log) (e.g. twitter (R)) is a server connected. このようなブログサーバは、不特定多数の第三者からのコメント文章を受信し、他の第三者へ公開する。 Such a blog server receives the comment text from an unspecified number of third parties, to publish to other third parties. このようなコメント文章は、様々な話題について公開されており、勿論、前述した質問回答システムに入出力される質問文及び回答文に関連するコメント文章も多く議論されている。 Such a comment sentences, have been published on a variety of topics, of course, has been discussed many comments sentence related to the question and answer sentence is input to and output from the question-and-answer system described above.

特開2011−81626号公報 JP 2011-81626 JP 特開2005−141428号公報 JP 2005-141428 JP 特開2005−284209号公報 JP 2005-284209 JP

KDDI、「au one NETコンシェルジュ」、[online]、[平成24年10月7日検索]、インターネット<URL: http://concierge.auone-net.jp/inagoNetPeople/BrowserClient/GUI/kddi_missConcie3/help/help.html> 坪坂正志、「Latent Dirichlet Allocation入門」、[online]、[平成24年10月7日検索]、インターネット<URL:http://www.slideshare.net/tsubosaka/tokyotextmining> 榊博史、松本一則、黒岩眞吾、橋本和夫、「再起演算を用いた自然言語変換方式」、電子情報通信学会論文誌(D-II), Vol.J72-D-II, No.12, pp.2080-2093, Dec. 1989、[online]、[平成24年10月7日検索]、インターネット<URL:http://jglobal.jst.go.jp/public/20090422/200902065122383276> KDDI, "au one NET concierge", [online], [2012. October 7, the search], Internet <URL: http://concierge.auone-net.jp/inagoNetPeople/BrowserClient/GUI/kddi_missConcie3/help/ help.html> Tsubozaka Masashi, "Latent Dirichlet Allocation Getting Started", [online], [2012. October 7, the search], Internet <URL: http: //www.slideshare.net/tsubosaka/tokyotextmining> Hiroshi Sakaki Kazunori Matsumoto, Kuroiwa Shingo, Kazuo Hashimoto, "natural language conversion method using a recovery operation", IEICE (D-II), Vol.J72- D-II, No.12, pp.2080- 2093, Dec. 1989, [online] , [ 2012. October 7, the search], Internet <URL: http: //jglobal.jst.go.jp/public/20090422/200902065122383276>

しかしながら、同じ質問文であっても、そのユーザの質問の意図が複数あり得る場合がある。 However, even with the same question, it may be more intended for that user's question. このような場合、ユーザに対して、適切な回答文が返答されない場合が多い。 In such a case, the user often appropriate answer message is not answered.

ユーザの質問文の例 Q「携帯電話機の紛失」 An example of a user of the question sentence Q, "the loss of a mobile phone."
この質問文に対して、質問回答システムは、以下の2つキーワードを抽出する。 To this question sentence, question answering system extracts two keywords below.
「携帯電話機」「紛失」 "Mobile phone", "Lost"
これらキーワードをクエリとして回答文を検索すると、複数の回答の選択肢がある。 When you search for answer sentence these keywords as a query, there is a choice of multiple answers.
A「携帯探せて安心サービスの申込方法」に関する回答文 A「携帯探せて安心サービスの利用方法」に関する回答文 この場合、ユーザとしては、紛失した携帯電話機を遠隔からロックする「利用方法」を問い合わせたつもりであるにも拘わらず、質問回答システムは、「申込方法」について回答してしまう場合もある。 A "mobile look and how to apply for relief services" for the answer sentence A "how to use the mobile phone look and peace of mind service" for the answer sentence in this case, as the user, query the "method of use" to lock the lost mobile phone from the remote going to be in spite of the answers to a question the system, in some cases result in answers to "How to apply".

そこで、本発明は、ユーザの質問文に対して複数の回答文の候補が存在する場合、ユーザの意図を反映した回答文を明示する(に絞り込む)ことができる質問回答プログラム、サーバ及び方法を提供することを目的とする。 Accordingly, the present invention is, if there are plural candidates for an answer message to the user of the question, demonstrating the answer sentence that reflects the intention of the user (narrow down) Question answer program capable, server and method an object of the present invention is to provide.

本発明によれば、多数のコメント文章を蓄積したコメント文章蓄積部と、多数の回答文を蓄積した回答文蓄積部とを有し、ユーザからの質問文に対する回答文を抽出するようにコンピュータを機能させる質問回答プログラムであって、 According to the present invention, a number of comments and sentences were accumulated comment sentence storage unit, and a plurality of answer sentence accumulation unit that accumulates the reply sentence, the computer to extract the answer sentence to the question sentence from the user a question-and-answer program to function,
質問文を入力する質問文入力手段と、 And the question text input means for inputting a question sentence,
質問文に含まれる複数の質問キーワードを抽出する質問キーワード抽出手段と、 A question keyword extracting means for extracting a plurality of query keywords included in the question sentence,
コメント文章蓄積部を用いて、質問キーワードを含むコメント文章を検索するコメント文章検索手段と、 Comments by using the sentence accumulation unit, and comments text retrieval means for retrieving the comment sentence, including the question keyword,
検索された複数のコメント文章を、述語項構造解析によって、述語項構造の分布から複数個のトピックグループに分類するトピック分類手段と、 A plurality of comment sentences retrieved, by predicate argument structure analysis, the topic classification means for classifying the distribution of predicate argument structure into a plurality of topic group,
各トピックグループに含まれるコメント文章群と、各回答文に含まれる文章との間の類似度を算出し、各トピックグループに類似度が所定閾値以上となる回答文を対応付ける回答文検出手段と、 And comments sentence group included in each topic group, the similarity is calculated, and the similarity to each topic group and answer message detecting means for associating the reply sentence equal to or greater than a predetermined threshold value between the text contained in each reply sentence,
各トピックグループについて、対応付けられた回答文に含まれる述語項構造の中で、当該トピックグループを特徴付ける代表述語項構造を抽出する代表述語項構造抽出手段と、 For each topic group, in the predicate argument structure contained in the associated reply sentence, the representative predicate argument structure extraction means for extracting a representative predicate argument structure that characterizes the topic group,
各トピックグループについて、当該トピックグループのみに出現する代表述語項構造を、差分述語項構造として抽出する差分述語項構造抽出手段と、 For each topic group, the representative predicate argument structure appearing only to the topic group, the difference predicate argument structure extraction means for extracting a difference predicate argument structure,
回答文検出手段によって検出された回答文を、対応する1つ以上の差分述語項構造に基づく文章と共に明示する回答文出力手段としてコンピュータを機能させることを特徴とする。 The detected answer sentence by answer sentence detection means, characterized by causing a computer to function as one or more corresponding answer message output unit manifest with text based on the difference predicate argument structure.

本発明の質問回答プログラムにおける他の実施形態によれば、 According to another embodiment of the question answering program of the present invention,
複数の差分述語項構造に基づく文章を、ユーザインタフェースを介してユーザに明示すると共に、ユーザ操作に応じていずれか1つの差分述語項構造を選択させる差分述語項構造選択手段を更に有し、 A sentence based on the plurality of difference predicate argument structure, with clearly to the user via the user interface further includes a differential predicate argument structure selection means for selecting any one differential predicate argument structure in response to a user operation,
回答文出力手段は、選択された文章の差分述語項構造に対応する回答文を、ユーザインタフェースを介して明示するようにコンピュータを機能させることも好ましい。 Reply sentence output means, a reply sentence corresponding to the difference predicate argument structure of the selected text, it is also preferred to a computer to function as best via the user interface.

本発明の質問回答プログラムにおける他の実施形態によれば、トピック分類手段は、当該コメント文章を、分類された各トピックグループに属する確からしさ(トピック比率)を算出するLDA(Latent Dirichlet Allocation)アルゴリズムを用いて、いずれか1つのトピックグループに分類するようにコンピュータを機能させることも好ましい。 According to another embodiment of the question answering program of the present invention, topic classification means, the comment sentence, the LDA (Latent Dirichlet Allocation) algorithm for computing classification certainty that belong to each topic groups that are the (Topics ratio) using any one of causing a computer to function so as to classify the topic group is also preferred.

本発明の質問回答プログラムにおける他の実施形態によれば、 According to another embodiment of the question answering program of the present invention,
回答文検出手段は、 Answer sentence detection means,
各トピックグループに含まれるコメント文章群から、述語項構造解析によって述語項構造を抽出すると共に、トピックグループにおける第1の特徴ベクトルを算出し、 From the comment sentence group included in each topic group, it extracts the predicate argument structure by predicate argument structure analysis, calculating a first feature vector in topic group,
回答文蓄積部に蓄積された各回答文から、述語項構造解析によって述語項構造を抽出すると共に当該回答文における第2の特徴ベクトルとを算出し、 From each answer message stored in the answer message storage unit, it calculates a second feature vector in the answer message extracts the predicate argument structure by predicate argument structure analysis,
トピックグループの第1のベクトルと、回答文の第2のベクトルとの間のコサイン距離に基づいて類似度を算出するようにコンピュータを機能させることも好ましい。 A first vector of topic group, causing a computer to function so as to calculate the similarity based on the cosine distance between the second vector of answer message is also preferred.

本発明の質問回答プログラムにおける他の実施形態によれば、代表述語項構造抽出手段は、各トピックグループの代表述語項構造を、赤池情報量基準に応じて優先順に並べるようにコンピュータを機能させることも好ましい。 According to another embodiment of the question answering program of the present invention, representative predicate argument structure extraction means, that a representative predicate argument structure of each topic group, causes a computer to function as arranged in order of priority in accordance with the Akaike Information Criterion It is also preferred.

本発明の質問回答プログラムにおける他の実施形態によれば、 According to another embodiment of the question answering program of the present invention,
コメント文章は、不特定多数の第三者によって投稿されたものであって、 Comments sentence, which has been posted by an unspecified number of third parties,
コメント文章蓄積部は、ミニブログ(mini Web log)サーバに投稿されたコメント文章を収集し蓄積したものであるようにコンピュータを機能させることも好ましい。 Comments sentence storage unit, it is also preferable to a computer to function as one in which to collect the comment sentence that has been posted to the mini-blog (mini Web log) server storage.

本発明によれば、多数のコメント文章を蓄積したコメント文章蓄積部と、多数の回答文を蓄積した回答文蓄積部とを有し、ユーザからの質問文に対する回答文を抽出する質問回答サーバであって、 According to the present invention, and comments sentence storage unit that accumulates a large number of comments sentence and a plurality of answer sentence answer sentence accumulation unit that accumulates and a question answer server to extract the answer message to the question sentence from the user there,
端末から、質問文を入力する質問文入力手段と、 From the terminal, and the question text input means for inputting a question sentence,
質問文に含まれる複数の質問キーワードを抽出する質問キーワード抽出手段と、 A question keyword extracting means for extracting a plurality of query keywords included in the question sentence,
コメント文章蓄積部を用いて、質問キーワードを含むコメント文章を検索するコメント文章検索手段と、 Comments by using the sentence accumulation unit, and comments text retrieval means for retrieving the comment sentence, including the question keyword,
検索された複数のコメント文章を、述語項構造解析によって、述語項構造の分布から複数個のトピックグループに分類するトピック分類手段と、 A plurality of comment sentences retrieved, by predicate argument structure analysis, the topic classification means for classifying the distribution of predicate argument structure into a plurality of topic group,
各トピックグループに含まれるコメント文章群と、各回答文との間の類似度を算出し、各トピックグループに類似度が所定閾値以上となる回答文を対応付ける回答文検出手段と、 And comments sentence group included in each topic group, the similarity is calculated, and the similarity to each topic group and answer message detecting means for associating the reply sentence equal to or greater than a predetermined threshold value between each answer sentence,
各トピックグループについて、対応付けられた回答文に含まれる述語項構造の中で、当該トピックグループを特徴付ける代表述語項構造を抽出する代表述語項構造抽出手段と、 For each topic group, in the predicate argument structure contained in the associated reply sentence, the representative predicate argument structure extraction means for extracting a representative predicate argument structure that characterizes the topic group,
各トピックグループについて、当該トピックグループのみに出現する代表述語項構造を、差分述語項構造として抽出する差分述語項構造抽出手段と、 For each topic group, the representative predicate argument structure appearing only to the topic group, the difference predicate argument structure extraction means for extracting a difference predicate argument structure,
回答文検出手段によって検出された回答文を、対応する1つ以上の差分述語項構造に基づく文章と共に明示する回答文出力手段とを有することを特徴とする。 The detected answer sentence by answer sentence detection means, and having a corresponding one or more difference predicate argument structure manifests with text based answer message output means.

本発明の質問回答サーバにおける他の実施形態によれば、 According to another embodiment of the question answering server of the present invention,
複数の差分述語項構造に基づく文章を、ユーザインタフェースを介してユーザに明示すると共に、ユーザ操作に応じていずれか1つの差分述語項構造を選択させる差分述語項構造選択手段を更に有し、 A sentence based on the plurality of difference predicate argument structure, with clearly to the user via the user interface further includes a differential predicate argument structure selection means for selecting any one differential predicate argument structure in response to a user operation,
回答文出力手段は、選択された文章の差分述語項構造に対応する回答文を、ユーザインタフェースを介して明示することも好ましい。 Reply sentence output means, a reply sentence corresponding to the difference predicate argument structure of the selected text, it is also preferable to explicitly via a user interface.

本発明によれば、多数のコメント文章を蓄積したコメント文章蓄積部と、多数の回答文を蓄積した回答文蓄積部とを有し、ユーザからの質問文に対する回答文を抽出する装置における質問回答方法であって、 According to the present invention, and comments sentence storage unit that accumulates a large number of comments sentence and a plurality of answer sentence answer sentence accumulation unit that accumulates the answers to a question in an apparatus for extracting an answer sentence to the question sentence from the user there is provided a method,
質問文を入力する第1のステップと、 And the first step to enter the question,
質問文に含まれる複数の質問キーワードを抽出する第2のステップと、 A second step of extracting a plurality of query keywords included in the question sentence,
コメント文章蓄積部を用いて、質問キーワードを含むコメント文章を検索する第3のステップと、 Comment using sentence storage section, a third step of retrieving a comment sentence containing question keyword,
検索された複数のコメント文章を、述語項構造解析によって、述語項構造の分布から複数個のトピックグループに分類する第4のステップと、 A plurality of comment sentences retrieved, by predicate argument structure analysis, a fourth step of classifying the distribution of predicate argument structure into a plurality of topic group,
各トピックグループに含まれるコメント文章群と、各回答文との間の類似度を算出し、各トピックグループに類似度が所定閾値以上となる回答文を対応付ける第5のステップと、 And comments sentence group included in each topic group, the similarity is calculated, and the similarity to each topic group and a fifth step of associating the reply sentence equal to or greater than a predetermined threshold value between each answer sentence,
各トピックグループについて、対応付けられた回答文に含まれる述語項構造の中で、当該トピックグループを特徴付ける代表述語項構造を抽出する第6のステップと、 For each topic group, in the predicate argument structure contained in reply sentence associated with, a sixth step of extracting a representative predicate argument structure that characterizes the topic group,
各トピックグループについて、当該トピックグループのみに出現する代表述語項構造を、差分述語項構造として抽出する第7のステップと、 For each topic group, a seventh step of extracting a representative predicate argument structure appearing only to the topic group, the difference predicate argument structure,
第5のステップによって検出された回答文を、対応する1つ以上の差分述語項構造に基づく文章と共に明示する第8のステップとを有することを特徴とする。 The detected answer sentence by the fifth step, and having an eighth step demonstrates with text based on a corresponding one or more difference predicate-argument structures.

本発明の質問回答方法における他の実施形態によれば、 According to another embodiment of the question answering process of the present invention,
第8のステップについて、 The steps of the eighth,
複数の差分述語項構造に基づく文章を、ユーザインタフェースを介してユーザに明示すると共に、ユーザ操作に応じていずれか1つの差分述語項構造を選択させ、 A sentence based on the plurality of difference predicate argument structure, with clearly to the user via the user interface, to select one of the differential predicate argument structure in response to a user operation,
選択された文章の差分述語項構造に対応する回答文を、ユーザインタフェースを介して明示することも好ましい。 The reply sentence corresponding to the difference predicate argument structure of the selected text, it is also preferable to explicitly via a user interface.

本発明の質問回答プログラム、サーバ及び方法によれば、ユーザの質問文に対して複数の回答文の候補が存在する場合、ユーザの意図を反映した回答文を明示する(に絞り込む)ことができる。 Question answer program of the present invention, according to the server and method, when there are plural candidates for an answer message to the user of the question, (narrowed down) the answer sentence that reflects the intention of the user demonstrates that it is .

本発明におけるシステム構成図である。 It is a system configuration diagram of the present invention. 本発明における質問回答サーバの機能構成図である。 It is a functional block diagram of a question answering server in the present invention. 質問キーワード抽出部及びコメント文章検索部の処理を表す説明図である。 Question keyword extraction section and a diagram of the process of the comment sentence search unit. トピック分類部の処理を表す説明図である。 It is a diagram of the process of the topic classification unit. 回答文検出部の処理を表す説明図である。 It is a diagram of the process of the answer message detecting unit. 代表述語項構造抽出部、差分述語項構造抽出部、差分述語項構造選択部及び回答文出力部の処理を表す説明図である。 Representative predicate argument structure extraction unit, a difference predicate argument structure extraction unit, is a diagram of the processing of the difference predicate argument structure selection unit and reply sentence output section. 本発明におけるシーケンス図である。 It is a sequence diagram in the present invention.

以下、本発明の実施の形態について、図面を用いて詳細に説明する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.

図1は、本発明におけるシステム構成図である。 Figure 1 is a system configuration diagram of the present invention.

図1によれば、インターネット上に、本発明における質問回答サーバ1が接続されている。 According to Figure 1, on the Internet, question answering server 1 in the present invention is connected. 質問回答サーバ1は、回答文を予め蓄積しているものであってもよいし、他の回答文蓄積サーバ2から回答文を受信するものであってもよい。 Question answer server 1 may be one in advance accumulates answer sentence, it may be configured to receive the answer message from another reply sentence storage server 2. 尚、本発明によれば、FAQのような質問文候補と回答文候補とを予め紐付けて記憶しておく必要はない。 Incidentally, according to the present invention, there is no need to store the attached advance string question candidate and answer sentence candidates, such as FAQ. あくまで、回答文候補のみを予め蓄積している。 Only, in advance accumulated the only answer sentence candidates.

質問者が操作する端末4は、アクセスネットワーク及びインターネットを介して、質問回答サーバ1へアクセスする。 Terminal 4 questioner operated via the access network and the Internet, accesses the question answering server 1. そして、端末4は、質問文を質問回答サーバ1へ送信し、これに対し、質問回答サーバ1から回答文を受信する。 Then, the terminal 4 transmits a question message to the question answering server 1, contrast, receives the answer message from the question answers server 1. 以下の実施形態の中では、質問者が自然言語のテキストで端末4へ入力することを想定しているが、質問者が音声で入力しテキストに変換されたものであってもよい。 Following in the embodiments, although questioner is supposed to be input to the terminal 4 in the natural-language text, the questioner may be those that are converted to text entered by voice.

また、図1によれば、不特定多数の第三者から投稿されたコメント文章を公開するブログサーバ3が、インターネットに更に接続されている。 Further, according to FIG. 1, the blog server 3 that exposes the comment text posted by unspecified number of third parties, and further connected to the Internet. ブログサーバ3は、例えばtwitter(登録商標)サーバのようなミニブログサーバである。 The blog server 3 is, for example, a mini-blog server, such as twitter (registered trademark) server. 不特定多数の第三者は、自ら所持する端末5を用いて、ミニブログサーバ3へコメント文章を自由に投稿することができる。 An unspecified number of third parties, can be using the terminal 5 to their own possession, free to post a comment sentence to the mini-blog server 3.

本発明における質問回答サーバ1は、ミニブログサーバ3から大量のコメント文章を収集する。 Question Answer server 1 according to the present invention is to collect a large amount of comment text from the mini-blog server 3. そして、質問回答サーバ1は、ユーザの質問文に対して複数の回答文の候補が存在する場合、収集したコメント文章を用いて、ユーザの意図を反映した回答文を明示する(に絞り込む)。 Then, Question Answer server 1, if there is a plurality of candidates for the answer sentence to the user of the question, using the collected comments sentence, (narrowed down to) the answer sentence that reflects the intention of the user manifest.

図2は、本発明における質問回答サーバの機能構成図である。 Figure 2 is a functional block diagram of a question answering server in the present invention.

図2によれば、質問回答サーバ1は、通信インタフェース部10と、回答文蓄積部101と、回答文取得部111と、コメント文章蓄積部102と、コメント文章収集部112とを有する。 According to FIG. 2, question answering server 1 includes a communication interface unit 10, a reply sentence storage section 101, a reply sentence obtaining unit 111, a comment sentence storage section 102, and a comment sentence acquisition unit 112.

回答文蓄積部101は、多数の回答文を蓄積する。 Reply sentence storage section 101 stores the number of answer message. 回答文取得部111が、これら回答文を、ネットワークを介して回答文蓄積サーバ2から受信し、回答文蓄積部101へ蓄積するものであってもよい。 Reply sentence obtaining unit 111, these answer sentence, via the network is received from the reply sentence storage server 2, or may be accumulated into the answer message storage unit 101.

コメント文章蓄積部102は、不特定多数の第三者によって投稿された多数のコメント文章を蓄積する。 Comments sentence storage section 102 stores the number of comments sentence posted by an unspecified number of third parties. コメント文章収集部112が、これらコメント文章を、ネットワークを介してブログサーバ3から受信し、コメント文章蓄積部102へ蓄積するものであってもよい。 Comments sentence acquisition unit 112, these comments sentence received from the blog server 3 via the network, it may be configured to accumulate the comment sentence storage section 102.

「コメント文章」とは、例えばtwitter(登録商標)で発信された、日本語の「つぶやき」(最大文字数:140文字)のようなものである。 The "comment sentence", for example, originated in twitter (registered trademark), "murmur" of the Japanese: is like a (maximum number of characters to 140 characters). コメント文章は、例えば、ユーザid(from_user_id)、つぶやきID(id_str)、発信時間(created_at)、つぶやき(texts)を含む。 Comments sentence includes, for example, a user id (from_user_id), tweet ID (id_str), transmission time (created_at), tweet (texts). ここで、コメント文章収集部112は、予め指定した複数のキーワードを含むコメント文章のみを収集することもできる。 Here, comments sentence acquisition unit 112 may also be collected only comment sentence including a plurality of keywords previously designated.

また、図2によれば、質問回答サーバ1は、質問文入力部121と、質問キーワード抽出部122と、コメント文章検索部123と、トピック分類部124と、回答文検出部125と、代表述語項構造抽出部126と、差分述語項構造抽出部127と、差分述語項構造選択部128と、回答文出力部129とを有する。 In addition, according to FIG. 2, question answering server 1, a question input unit 121, a question keyword extracting unit 122, a comment sentence searching unit 123, a topic classification unit 124, a reply sentence detecting unit 125, the representative predicate having a section structure extraction unit 126, a difference predicate argument structure extraction unit 127, a difference predicate argument structure selection unit 128, and an answer sentence output section 129. これら機能構成部は、サーバに搭載されたコンピュータを機能させるプログラムを実行することによって実現される。 These functional components may be realized by executing a program that causes a computer mounted on the server.

[質問文入力部121] [Question input unit 121]
質問文入力部121は、質問者の端末4から、ネットワークを介して質問文を受信する。 Question input unit 121, from the question's terminal 4 receives the question sentence via the network. 例えばユーザの質問文は、以下のようなものである。 For example, a user of the question is, is as follows.
Q「携帯電話機の紛失」 Q "the loss of a mobile phone."
その質問文は、質問キーワード抽出部122へ出力される。 The question sentence is output to the question keyword extracting section 122.

図3は、質問キーワード抽出部及びコメント文章検索部の処理を表す説明図である。 Figure 3 is an explanatory diagram showing the processing of the question keyword extracting unit and a comment sentence search unit.

[質問キーワード抽出部122] [Question keyword extraction unit 122]
質問キーワード抽出部122は、質問文に含まれる複数の質問キーワードを抽出する。 Question keyword extracting unit 122 extracts a plurality of query keywords included in the question sentence. ここで、質問キーワード抽出部122は、質問文から形態素解析によってキーワードを抽出すると共に、TF−IDF(Term Frequency - Inverse Document Frequency:単語の出現頻度−逆出現頻度)によって特徴的な単語を、質問キーワードとして抽出する。 Here, the question keyword extracting section 122 extracts a keyword by morphological analysis from the question sentence, TF-IDF (Term Frequency - Inverse Document Frequency: word frequency - inverse document frequency) characteristic words by question It is extracted as a keyword.

質問キーワード抽出部122は、最初に、質問文から形態素解析によって単語を抽出する。 Question keyword extraction section 122 first extracts a word by morphological analysis from the question sentence. 「形態素解析」とは、文章を、意味のある単語に区切り、辞書を利用して品詞や内容を判別する技術をいう。 The term "morphological analysis", the sentence, separated into words that make sense, refers to the technique of using a dictionary to determine the part of speech and content. 「形態素」とは、文章の要素のうち、意味を持つ最小の単位を意味する。 The term "morpheme", out of the sentence of the element, which means the smallest unit that has a meaning. 形態素解析のように単語単位で検索することなく、文字単位で分解し、後続の N-1文字を含めた状態で出現頻度を求める「N-gram」によって解析するものであってもよい。 Without searching word by word as morphological analysis, decompose in characters, obtaining the appearance frequency in the state, including the subsequent N-1 characters may be configured to analyze the "N-gram."

次に、TF−IDFによって特徴的なキーワードを、質問キーワードとして抽出する。 Next, a characteristic keyword by TF-IDF, extracted as question keyword. TF−IDFとは、各単語に重みを付けて、クエリから文章をベクトル空間で表し、文章とクエリの類似度でランク付けをする技術である。 The TF-IDF, with a weight to each word represents a sentence from the query in a vector space, which is a technique for ranking in the text and query similarity. ランク付けられた値が高いほど、重要キーワードと認識される。 The higher the rank Tagged value, is recognized as important keyword.

図3の例によれば、以下のように抽出される。 According to the example of FIG. 3, it is extracted as follows.
質問文 「携帯電話機の紛失」 Question, "the loss of a mobile phone."
質問キーワード「携帯電話機」「紛失」 The question keyword "mobile phone", "Lost"

[コメント文章検索部123] [Comment sentence search unit 123]
コメント文章検索部123は、コメント文章蓄積部102を用いて、質問キーワードを含むコメント文章を検索する。 Comments sentence search unit 123, using the comment sentence storage section 102, searches the comment sentence containing the query keywords. 具体的には、質問キーワードをクエリとして、各コメント文章からTF(Term Frequency)値やDF(Document Frequency)値を抽出し、これら値が所定閾値以上となる複数のコメント文章を検索する。 Specifically, the question keyword as a query, TF and (Term Frequency) value and DF (Document Frequency) values ​​extracted from each comment sentence search for multiple comment sentence these values ​​is equal to or greater than a predetermined threshold value. TF値は、文章における検索語の出現頻度をいい、DF値は、索引語が現れる相対文章頻度をいう。 TF value refers to the frequency of occurrence of the search word in the sentence, DF value refers to the relative sentence frequency with which the index word appears. コメント文章検索部123は、ソーシャルメディア検索機能であって、投稿された大量のつぶやきの中から、質問キーワードに関するつぶやきのみを検索するようなものである。 Comments sentence search unit 123 is a social media search function, from a large number of tweets that have been posted, is such as to search only tweets about the question keyword.

図3によれば、例えば4つのコメント文章が検索されている。 According to FIG. 3, for example, 4 Comments sentences are searched. これらコメント文章には、少なくとも「携帯電話機」又は「紛失」が含まれている。 These comments sentence, are included at least "mobile phone" or "lost".

図4は、トピック分類部の処理を表す説明図である。 Figure 4 is an explanatory diagram showing the processing of the topic classification unit.

[トピック分類部124] [Topic classification section 124]
トピック分類部124は、検索された複数のコメント文章を、述語項構造解析によって、述語項構造の分布から複数個のトピックグループに分類する。 Topic classification unit 124, a plurality of comments sentences retrieved by predicate argument structure analysis, to classify the distribution of the predicate terms structure into a plurality of topic group. トピック分類部124は、当該コメント文章を、分類された各トピックグループに属する確からしさ(トピック比率)を算出するLDA(Latent Dirichlet Allocation)アルゴリズムを用いて、いずれか1つのトピックグループに分類する。 Topic classification unit 124, the comment sentence, the likelihood belonging classified each topic groups were using LDA (Latent Dirichlet Allocation) algorithm for computing (topic proportions) are classified into one of the topic group. 特に、トピック分類部124のLDAは、キーワードによる分類でなく、述語項構造による分類である。 In particular, the LDA topic classification unit 124, instead of classification according to the keyword, a classification by predicate argument structure.

LDAは、単語文書行列を次元圧縮する技術(LSI(latent Semantic Indexin))に対して、単語の特徴ベクトルに揺らぎに基づく確率的な枠組みを導入したものである(例えば非特許文献2参照)。 LDA, to the technique for compressing dimension word document matrix (LSI (latent Semantic Indexin)), is introduced in a probabilistic framework based on fluctuations in the feature vector of words (for example, see Non-Patent Document 2). その圧縮した次元の集合をトピックという。 A set of the compressed dimension that topic.

また、「述語項構造」とは、文章中の述語に対して「項」となる名詞句等を当てたものである。 In addition, the "predicate term structure", in which rely on the noun phrase or the like to be a "claim" to the predicate in a sentence. 述語項構造を用いることによって、文章の意味の骨格を把握することができる。 By using the predicate argument structure, it is possible to grasp the frame of the meaning of the sentence. 述語項構造解析として、例えばフリーソフトであるSyncha等の述語項構造解析器を用いることができる。 As predicate argument structure analysis, it is possible to use predicate argument structure analysis instrument such Syncha for example free software.

述語項構造は、「述語」に対する「目的語」とその格とから構成される。 Predicate argument structure is composed of and its Case "object" to the "predicate". 図4によれば、例えば「携帯を探す」の述語項構造は、述語「探す」に対して目的語「携帯」及び格「ヲ」からなる。 According to FIG. 4, predicate-argument structures such as "Find portable" consists object relative to the predicate "search", "mobile" and rated "wo". また、例えば「サービスに申し込む」の述語項構造は、述語「申し込む」に対して目的語「サービス」及び格「ニ」からなる。 Further, predicate argument structures such as "sign up for the service" consists object relative to the predicate "subscribe", "Service" and rated "D".

トピック分類部124は、以下のステップで処理を実行する。 Topic classification unit 124 executes processing in the following steps.
(S41)質問キーワードに関する多数のコメント文章から、述語項構造毎の出現頻度(出現回数)をLDA処理へ入力する。 (S41) from a large number of comments sentence about the question keyword, enter the frequency of occurrence of each predicate term structure (number of occurrences) to the LDA process. そして、コメント文章毎に、各述語項構造の出現頻度を計数する。 Then, for each comment sentence, counting the frequency of occurrence of each predicate argument structure.
(S42)次に、本件でのLDA処理では、トピック毎の述語項構造分布や、コメント文章(ネット側意見)毎のトピック比率を取得する。 (S42) Next, with LDA treatment with this matter, obtains and predicate argument structure distribution for each topic, the topic proportions of each comment sentence (net side views). このトピック比率によって、コメント文章が属するトピックグループに分類する。 This topic ratio, classified into topic groups that comment sentence belongs. そして、トピックグループ毎に、全てのコメント文章に含まれる各述語項構造の出現頻度を計数する。 Then, for each topic group, it counts the frequency of occurrence of each predicate term structure that is included in all of the comment sentence.
(S43)次に、コメント文章毎に、各トピックグループに属する述語項構造を計数する。 (S43) Next, for each comment sentence, counting the predicate term structure belonging to each topic group. そして、コメント文章を計数値の高いトピックグループに分類する。 Then, to classify the comment sentence in the high topic group of the count value.

図5は、回答文検出部の処理を表す説明図である。 Figure 5 is an explanatory diagram showing the processing of the answer message detecting unit.

[回答文検出部125] [Answer sentence detection unit 125]
回答文検出部125は、各トピックグループに含まれるコメント文章群と、各回答文に含まれる文章との間の類似度を算出し、各トピックグループに類似度が所定閾値以上となる回答文を対応付ける。 Reply sentence detecting unit 125, a comment sentence group included in each topic group, calculates the degree of similarity between the text contained in each reply sentence, the reply sentence similarity is equal to or greater than a predetermined threshold value to each topic group associates.

類似度の算出方法は、例えば以下のようにする。 The method of calculating the similarity, for example, as follows.
(S51)回答文検出部125は、各トピックグループに含まれるコメント文章群から述語項構造解析によって述語項構造を抽出すると共に、トピックグループにおける第1の特徴ベクトルを算出する。 (S51) the answer sentence detecting unit 125 extracts a predicate argument structure by predicate argument structure analysis from the comment sentence group included in each topic group, it calculates the first feature vector in topic group.
各トピックグループ:Ci(i=1,2,・・・) Each topic group: Ci (i = 1,2, ···)
トピックグループiに含まれるコメント文章:Tij(j=1,2,・・・) Comments sentence is included in the topic group i: Tij (j = 1,2, ···)
(S52)回答文蓄積部101に蓄積された各回答文から述語項構造解析によって述語項構造を抽出すると共に、当該回答文における第2の特徴ベクトルとを算出する。 (S52) extracts a predicate argument structure by predicate argument structure analysis from say the answer message stored in the sentence storage section 101, calculates a second feature vector in the answer sentence.
回答文:Ak(k=1,2,・・・) Answer sentence: Ak (k = 1,2, ···)
(S53)トピックグループの第1のベクトルと、回答文の第2のベクトルとの間のコサイン距離に基づいて類似度を算出する。 (S53) calculates a first vector of topic group, the degree of similarity based on the cosine distance between the second vector reply sentence. 具体的には、各コメント文章Ti1, Ti2,・・・を含むトピックグループCiと、回答文Ajとの類似度Dist(Ci,Aj)を算出する。 More specifically, each comment sentence Ti1, Ti2, and topic groups Ci, including the ..., to calculate the similarity Dist of the answer sentence Aj (Ci, Aj).
Dist(Ci,Aj)=cosin距離D(Ti1,Aj),D(Ti2, Aj),・・・の平均値 Dist (Ci, Aj) = cosin distance D (Ti1, Aj), D (Ti2, Aj), the average value of ...
=argi max(Dist(Ci,Aj)) = Argi max (Dist (Ci, Aj))

図5によれば、回答文蓄積部101には、多数の回答文が蓄積されている。 According to FIG. 5, the reply sentence storage section 101, a number of answer message are stored.
回答文1「・・・」 Answer sentence 1 "..."
回答文2「携帯探せて安心サービスの申込方法」 Answer sentence 2 "application method for a portable look and peace of mind services."
述語項構造=述語「探す」、目的語「携帯」、ヲ格 Predicate argument structure = predicate "Find", object "portable", wo rated
述語項構造=述語「申し込む」、目的語「サービス」、ニ格 回答文3「・・・」 Predicate argument structure = "subscribe" predicate, object "service", two rated answer sentence 3 "..."
回答文4「・・・」 Answer sentence 4, "..."
回答文5「携帯探せて安心サービスの利用方法」 Answer sentence 5 "How to use mobile look and peace of mind services."
述語項構造=述語「探す」、目的語「携帯」、ヲ格 Predicate argument structure = predicate "Find", object "portable", wo rated
述語項構造=述語「利用する」、目的語「サービス」、ヲ格 回答文6「・・・」 Predicate argument structure = "Use" predicate, object "service", wo-rated answer sentence 6, "..."

図5によれば、トピックグループ1と回答文2との類似度が、所定閾値δよりも高い場合、両者は類似していると判定されている。 According to FIG. 5, the degree of similarity between the topic groups 1 and reply sentence 2 is higher than the predetermined threshold value [delta], both are judged to be similar. また、トピックグループ2と回答文5との類似度が、所定閾値δよりも高い場合、両者は類似していると判定されている。 Also, similarity between topic group 2 and answer sentence 5 is higher than the predetermined threshold value [delta], both are judged to be similar. これによって、トピックグループC1,C2,・・・毎に、0個以上の回答文が割り当てられる。 Thus, the topic group C1, C2, in every..., Are assigned zero or more of the answer sentence.

図6は、代表述語項構造抽出部、差分述語項構造抽出部、差分述語項構造選択部及び回答文出力部の処理を表す説明図である。 Figure 6 is a representative predicate argument structure extraction unit, a difference predicate argument structure extraction unit, is a diagram of the processing of the difference predicate argument structure selection unit and reply sentence output section.

[代表述語項構造抽出部126] [Representative predicate argument structure extracting section 126]
代表述語項構造抽出部126は、各トピックグループについて、対応付けられた回答文に含まれる述語項構造の中で、当該トピックグループを特徴付ける代表述語項構造を抽出する。 Representative predicate argument structure extracting section 126, for each topic group, in the predicate argument structure contained in the associated reply sentence to extract a representative predicate argument structure that characterizes the topic group.

図6によれば、トピックグループ1に対応する回答文2からは、以下の表のような述語項構造が抽出される。 According to FIG. 6, from the reply sentence 2 corresponding to the topic group 1, predicate-argument structures as shown in the following table are extracted.
回答文2「携帯探せて安心サービスの申し込み方法は以下のようになります・・・」 Answer sentence 2 "application method for a portable look and peace of mind service is as follows ..."
述語項構造=述語「探す」、目的語「携帯」、ヲ格 Predicate argument structure = predicate "Find", object "portable", wo rated
述語項構造=述語「申し込む」、目的語「サービス」、ニ格 回答文5「携帯探せて安心サービスの利用方法は以下のようになります・・・」 Predicate argument structure = predicate "subscribe", object "service", two rated answer sentence 5 "how to use the mobile phone look and peace of mind service is as follows ..."
述語項構造=述語「探す」、目的語「携帯」、ヲ格 Predicate argument structure = predicate "Find", object "portable", wo rated
述語項構造=述語「利用する」、目的語「サービス」、ヲ格 Predicate argument structure = "Use" predicate, object "service", wo rated

ここで、述語項構造抽出部126は、各トピックグループの代表述語項構造を、赤池情報量基準に応じて優先順に並べることも好ましい。 Here, predicate-argument structure extracting section 126, it is also preferable to arrange a representative predicate argument structure of each topic group, in order of preference according to Akaike information criterion. トピックグループC1,C2,・・・に割り当てられた回答文のいずれかに出現する述語項構造を、s1,s2,・・・とする。 Topic Group C1, C2, the predicate term structure that appears in any of the answer sentence assigned to the ···, s1, s2, and .... ここでは、述語項構造E(i)が、トピックグループCjの判別に役立つかどうかの指標を与える。 Here, the predicate term structure E (i) gives an indication of whether the help determine the topic group Cj.

以下では、述語項構造sが、トピックグループCの判別に役立つかどうかの指標E(s,C)の算出方法を表す。 The following predicate argument structures s is representative of the method of calculating the topic group C help determine whether an index E (s, C).

(S1)トピックグループ含まれるコメント文章(つぶやき)の集合Uから、以下の4種類の頻度を得る。 (S1) from a set U of comments sentence included topics group (murmur) to obtain four kinds of frequency of following.
n11=トピックグループCに類似し、述語項構造sが出現するコメント文章の数 n12=トピックグループC以外に類似し、述語項構造sが出現するコメント文章の数 n21=トピックグループCに類似し、述語項構造sが出現しないコメント文章の数 n22=トピックグループC以外に類似し、述語項構造sが出現しないコメント文章の数 n11 = similar to the topic group C, similar to other than the number n12 = Topic Group C of the comment sentence predicate argument structure s appears, similar to the number n21 = Topic Group C of the comment sentence predicate argument structure s appears, similar to other than the number n22 = topic group C of the comment sentence predicate argument structure s does not appear, the number of comments sentence predicate argument structure s does not appear

(S2)次に、n11,n12,n21,n22に対して、赤池情報量規準(AIC:Akaike's Information Criterion)を用いて、独立モデルに対する値MLL_IM(s,C)及び従属モデルに対する値MLL_DM(s,C)を算出する。 (S2) Next, n11, n12, n21, relative to n22, Akaike Information Criterion (AIC: Akaike's Information Criterion) using a value MLL_IM (s, C) for the independent model and values ​​for the dependent model MLL_DM (s , C) is calculated. これは、述語項構造とトピックグループとの組毎の不当割合を算出する。 It calculates the undue proportion of Kumigoto the predicate argument structure and topic group.
MLL_IM(s,C)=(n11+n12) log(n11+n12) MLL_IM (s, C) = (n11 + n12) log (n11 + n12)
+(n11+n21) log(n11+n21) + (N11 + n21) log (n11 + n21)
+(n21+n22) log(n21+n22) + (N21 + n22) log (n21 + n22)
+(n12+n22) log(n12+n22)−2N log N + (N12 + n22) log (n12 + n22) -2N log N
MLL_DM(s,C)=n11 log n11+n12 log n12+n21 log n21+n22 log n22−N log N MLL_DM (s, C) = n11 log n11 + n12 log n12 + n21 log n21 + n22 log n22-N log N
但し、N=n11+n12+n21+n22 However, N = n11 + n12 + n21 + n22

(S3)前述のMLL_IM(s,C)及びMLL_DM(s,C)から、以下のE(s,C)を算出する。 (S3) above the MLL_IM (s, C) and MLL_DM (s, C) from, and calculates the following E (s, C).
AIC_IM(s,C)=-2 × MLL_IM(s,C) + 2×2 AIC_IM (s, C) = - 2 × MLL_IM (s, C) + 2 × 2
AIC_DM(s,C)=-2 × MLL_DM(s,C) + 2×3 AIC_DM (s, C) = - 2 × MLL_DM (s, C) + 2 × 3
E(s,C)=AIC_IM(s, C) − AIC_DM(s,C) E (s, C) = AIC_IM (s, C) - AIC_DM (s, C)

前述で算出されたE(s,C)は、述語項構造sがトピックグループCに偏って出現する不当割合を表す。 Above calculated in E (s, C) represent undue proportion of predicate-argument structures s appears biased to topic group C. E(s,C)は、赤池情報量基準に従って、トピックグループCの判別に役立つ述語項構造ほど、E(s,C)の値が高くなる。 E (s, C), according to Akaike information criterion, as the predicate argument structure that helps determine the topic group C, the value of E (s, C) is increased. 本発明によれば、各トピックグループCiに対し、E(s,C)の値が大きい順に、m個の述語項構造 Ci,1、Ci,2、Ci,3、・・・Ci,m を抽出し、トピックグループCiの代表述語項構造とする。 According to the present invention, for each topic group Ci, E (s, C) in order value is large, m-number of predicate-argument structures Ci, 1, Ci, 2, Ci, 3, ··· Ci, the m extracted, as a representative predicate term structure of the topic group Ci.

[差分述語項構造抽出部127] Differential predicate argument structure extracting section 127]
差分述語項構造抽出部127は、各トピックグループについて、当該トピックグループのみに出現する代表述語項構造を、差分述語項構造として抽出する。 Difference predicate argument structure extracting section 127, for each topic group, the representative predicate argument structure appearing only to the topic group is extracted as a difference predicate argument structure. 回答文2及び5について、[述語項構造=述語「探す」、目的語「携帯」、ヲ格]は共通する。 For the answer sentence 2 and 5, [predicate argument structure = predicate "Find", object "portable", wo price] is common. そこで、図6によれば、以下の差分述語項構造が抽出される。 Therefore, according to FIG. 6, the following differences predicate argument structure is extracted.
回答文2「携帯探せて安心サービスの申し込み方法は以下のようになります・・・」 Answer sentence 2 "application method for a portable look and peace of mind service is as follows ..."
述語項構造=述語「申し込む」、目的語「サービス」、ニ格 回答文5「携帯探せて安心サービスの利用方法は以下のようになります・・・」 Predicate argument structure = predicate "subscribe", object "service", two rated answer sentence 5 "how to use the mobile phone look and peace of mind service is as follows ..."
述語項構造=述語「利用する」、目的語「サービス」、ヲ格 Predicate argument structure = "Use" predicate, object "service", wo rated

[差分述語項構造選択部128] Differential predicate argument structure selection unit 128]
差分述語項構造選択部128は、複数の差分述語項構造に基づく文章を、ユーザインタフェースを介してユーザに明示する。 Difference predicate argument structure selection unit 128 demonstrates a sentence based on the plurality of difference predicate argument structure, to the user via the user interface.

差分述語項構造からの日本語文章を生成するために、例えば以下のようなルールが設定される。 To generate a Japanese sentence from the difference predicate argument structure, for example, the following rules are set.
(ルール1)ヲ格のみからなる述語項構造Sの場合 (Rule 1) consisting wo rated only for predicate argument structure S
->W(S,ヲ格)+「を」+W(S,述語) -> W (S, wo price) + "wo" + W (S, predicate)
(ルール2)ヲ格とデ格からなる述語項構造Sの場合 (Rule 2) If the predicate-argument structure S made of wo rated and de-rated
->W(S,デ格)+「で」+W(S,ヲ格)+「を」+S(述語) -> W (S, de-rated) + "in" + W (S, wo price) + "wo" + S (predicate)
(ルール3)差分述語項構造S1のヲ格と、共通述語項構造Bのデ格とが一致する場合、 (Rule 3) When the wo rated differential predicate argument structure S1, and the de-rated common predicate argument structure B match,
->Aから生成した日本語のヲ格の前方修飾語として、Bの日本語を埋め込む W(S,ヲ格)は、述語項構造Sのヲ格の単語を表す。 -> as forward qualifier in Japanese wo rated generated from A, W (S, wo price) for embedding in Japanese B represents a word Wo skeleton of predicate-argument structures S.
W(S,デ格)は、述語項構造Sのデ格の単語を表す。 W (S, de-rated) represents the word of de-rating of the predicate term structure S.
尚、このようなルール基づく日本語の生成については、機械翻訳システムの技術が適用できる(例えば非特許文献3参照)。 Note that the generation of Japanese based Such rules may apply art machine translation system (e.g., see Non-Patent Document 3).

例えば、ルール1〜3を用いて、図6によれば、トピックグループ毎に、以下の2つの日本語文章が生成される。 For example, using the rules 1-3, according to FIG. 6, for each topic group, the following two Japanese sentences are generated.
「携帯を探すサービスを申し込む」 "Subscribe the service to find the mobile phone."
「携帯を探すサービスを利用する」 "Using the Find mobile services."

これに対し、端末4は、ユーザ操作に応じていずれか1つの差分述語項構造の文章を選択させる。 In contrast, the terminal 4 to select the text of one of the differential predicate argument structure in accordance with a user operation. ユーザから見ると、例えば、質問文をキーボードで入力した後、トピックグループ毎の差分述語項構造に基づいた自然な日本語文章がディスプレイに表示される。 From the user's point of view, for example, after entering the question on the keyboard, natural Japanese sentences based on the difference predicate term structure of each topic group is displayed on the display. そして、ユーザは、いずれかの文章を選択することができる。 Then, the user can select any of the sentences. ここで、図6によれば、ユーザは、「携帯を探すサービスを利用する」を選択している。 Here, according to FIG. 6, the user has selected the "Use the Find mobile services." ユーザに選択された文章の差分述語項構造は、回答文出力部129へ出力される。 Difference predicate argument structure of the selected sentence to the user is output to the reply sentence output section 129.

[回答文出力部129] [Reply sentence output section 129]
回答文出力部129は、回答文検出部125によって検出された回答文を、対応する1つ以上の差分述語項構造の文章と共に明示する。 Reply sentence output section 129, demonstrating the detected answer sentence by answer sentence detection unit 125, along with the text of the corresponding one or more difference predicate-argument structures. 本発明によれば、ユーザの質問に曖昧性があり、コメント文章群が複数のトピックグループに分類され、各トピックグループに対応付けられた回答文を得ることができる。 According to the present invention, there is ambiguity in the user's question, comment sentence group is classified into a plurality of topic group, it can be obtained answer sentence associated with each topic group. ここで、この得られた回答文の数が少ない場合、差分述語項構造に基づく文章は、提示される回答文の傾向をユーザが認識するために有益な情報となる。 Here, if the number of the obtained answer sentence is small, text-based difference predicate argument structure becomes useful information a tendency to an answer message to be presented for the user to recognize.

また、回答文の数が多い場合、ユーザとインタラクション(やりとり)をすることによって、回答文を絞り込むことが好ましい。 Also, if the number of reply sentences often by the user interacts (interact), it is preferable to narrow down the answer sentence. そこで、回答文出力部129は、選択された差分述語項構造に対応する回答文を、ユーザインタフェースを介して明示する。 Therefore, the reply sentence output section 129, demonstrating a reply sentence corresponding to the selected difference predicate argument structure, through the user interface. 例えば、その回答文を、ユーザが視認するディスプレイに表示する。 For example, the answer sentence, is displayed on the display visually recognized by the user. 図6によれば、「携帯探せて安心サービスの利用方法」の回答文が、ユーザへ表示される。 According to FIG. 6, the answer sentence of "how to use the mobile phone look and peace of mind service" is displayed to the user. これによって、ユーザは、質問文に対する回答文を認識することができる。 Thus, the user can recognize the answer message to the question sentence.

図7は、本発明におけるシーケンス図である。 Figure 7 is a sequence diagram in the present invention.

(S71)質問者が操作する端末4から、質問回答サーバ1へ、ユーザの質問文が送信される(図2の質問文入力部121参照)。 (S71) from the terminal 4 questioner operated, the question answering server 1, the user of the question message is transmitted (see question input unit 121 in FIG. 2).
(S72)質問回答サーバ1は、質問文に含まれる複数の質問キーワードを抽出する(図2の質問キーワード抽出部122参照)。 (S72) Question answer server 1 extracts a plurality of query keywords included in the question sentence (see Question keyword extraction section 122 of FIG. 2).
(S73)質問回答サーバ1は、コメント文章蓄積部102を用いて、質問キーワードを含むコメント文章を検索する(図2のコメント文章検索部123参照)。 (S73) Question answer server 1 uses the comment sentence storage section 102, searches the comment sentence containing query keywords (see comment sentence searching unit 123 of FIG. 2).
(S74)質問回答サーバ1は、検索された複数のコメント文章を、述語項構造解析によって、述語項構造の分布から複数個のトピックグループに分類する(図2のトピック分類部124参照)。 (S74) Question answer server 1, a plurality of comments sentences retrieved by predicate argument structure analysis, to classify the distribution of the predicate terms structure into a plurality of topic group (see topic classification unit 124 of FIG. 2).
(S75)質問回答サーバ1は、各トピックグループに含まれるコメント文章群と、各回答文との間の類似度を算出し、各トピックグループに類似度が所定閾値以上となる回答文を対応付ける(図2の回答文検出部125参照)。 (S75) Question answer server 1, and comments sentence group included in each topic group, calculates a similarity between each answer sentence associates reply sentence similarity is equal to or greater than a predetermined threshold value to each topic group ( see answer sentence detecting unit 125 of FIG. 2).
(S76)質問回答サーバ1は、各トピックグループについて、対応付けられた回答文に含まれる述語項構造の中で、当該トピックグループを特徴付ける代表述語項構造を抽出する(図2の代表述語項構造抽出部126参照)。 (S76) Question answer server 1, for each topic group, in the predicate argument structure contained in the associated reply sentence to extract a representative predicate argument structure that characterizes the topic group (in Figure 2 representative predicate argument structure Referring extraction unit 126).
(S77)質問回答サーバ1は、各トピックグループについて、当該トピックグループのみに出現する代表述語項構造を、差分述語項構造として抽出する(図2の差分述語項構造抽出部127参照)。 (S77) Question answer server 1, for each topic group, the representative predicate argument structure appearing only to the topic group is extracted as a difference predicate argument structure (see difference predicate argument structure extracting unit 127 of FIG. 2).
(S78)質問回答サーバ1は、複数の差分述語項構造に基づく文章を、ユーザ操作の端末4へ送信する(図2の差分述語項構造選択部128参照)。 (S78) Question answer server 1, a sentence based on the plurality of difference predicate argument structure, transmits to the terminal 4 of the user operation (see the difference predicate argument structure selection unit 128 of FIG. 2). そして、端末4では、ユーザ操作に応じていずれか1つの文章が選択させる。 Then, the terminal 4, any one of the sentence is selected in accordance with a user operation. 選択された文章の差分述語項構造は、端末4から質問回答サーバ1へ送信される。 Difference predicate argument structure of the selected text is transmitted from the terminal 4 to the question answering server 1.
(S79)質問回答サーバ1は、選択された差分述語項構造に対応する回答文を、ユーザの端末4へ送信する(図2の回答文出力部129参照)。 (S79) Question answer server 1, a reply sentence corresponding to the selected difference predicate argument structure is transmitted to the user terminal 4 (see reply sentence output section 129 in FIG. 2).

前述したように本発明の質問回答サーバによれば、例えばtwitterのような大量のコメント文章から、質問文の意図を表す代表的な述語項構造を抽出し、質問文を補完することによって、回答文を高精度に検索することができる。 According As described above questions answers server of the present invention, for example, by a large number of comments sentences such as twitter, extracts representative predicate argument structure representing the intent of the question sentence, to complement the question, answer it is possible to find sentences with high accuracy. 具体的には、最初に、質問文に含まれるキーワードを抽出してソーシャルメディアを検索し、大量の検索結果を複数のトピックグループ(トピック毎に1つの検索意図に対応)に高速に分類し、各トピックに類似する回答文を回答文蓄積部から検索する。 More specifically, first, to search for social media by extracting a keyword that is included in the question, are classified into high speed into a plurality of topic groups a large number of search results (corresponding to one search intended for each topic), Search for an answer sentence that is similar to each topic from the answer sentence storage unit. 次に、各トピックグループに特有の単語(差分述語項構造)を自動的に抽出してユーザに提示し、ユーザの選択結果に従った回答文に絞り込んで、ユーザとの対話形式を繰り返し実行することができる。 Then presented to the user and automatically selects words unique (differential predicate argument structure) to each topic group, narrow the reply sentence in accordance with the user's selection result repeatedly executes interactive with the user be able to.

以上、詳細に説明したように、本発明の質問回答プログラム、サーバ及び方法によれば、ユーザの質問文に対して複数の回答文の候補が存在する場合、ユーザの意図を反映した回答文を明示する(に絞り込む)ことができる。 As described above in detail, the question answers program of the present invention, according to the server and method, when there are plural candidates for an answer message to the user of the question, the answer sentence that reflects the intention of the user it can manifest (narrow down).

最後に、本発明が、キーワード検索ではなく、述語項構造検索を用いた効果について詳述する。 Finally, the present invention is not a keyword search, described in detail the effect of using a predicate-argument structure search.

一般に、例えば、「携帯電話が紛失したらどうしよう」というユーザからの短い質問の場合、「携帯電話紛失に備えたサービス申し込みの要望」なのか、又は、「端末の紛失への対応法に関する問い合わせ」なのかといった曖昧性が存在する。 In general, for example, in the case of a short question from a user named "NOW What if a mobile phone is lost", or "mobile phone service application which is provided to the lost demand" of the, or, "inquiry relates to a corresponding method to the loss of the terminal" ambiguity exists, such as whether such of. これに対し、コンテキストに依存した曖昧性を検出し、対話形式で回答候補を絞り込みながらTIPS等を返答する技術が提案されている(本願と同一出願人及び同一発明者によって出願された平成24年1月12日付け特許出願、以下「先の出願に係る発明」と称す)。 In contrast, to detect ambiguity context-sensitive, 2012. filed by interaction same applicant and (present techniques have been proposed to answer the TIPS like while narrowing possible answers in the form and the same inventor January 12, with patent application, hereinafter referred to as "the invention according to the earlier application"). この技術によれば、コンテキストの曖昧性を高速かつ適切に検出し、「安心、申し込み」や「端末、発見」といったキーワードを対話の選択肢として提示することができる。 According to this technique, the ambiguity of the context to detect fast and properly, "peace of mind, the application" can be presented and "terminal, discovery" the keyword, such as a choice of dialogue.

しかしながら、先の出願に係る発明によれば、第1の課題として、コンテキストを絞り込む際に「携帯紛失、サービス、申し込み」又は「携帯紛失、サービス、利用」といったキーワードが提示されるだけであって、、ユーザにとっては、コンテキストの差異を理解しづらい。 However, according to the invention of the earlier application, as the first problem, when Filter context "portable lost, service, application" or merely "Mobile lost, service, use" keywords such is presented ,, for the user, difficult to understand the differences of context.

また、第2の課題として、コンテキストの絞り込みが終了しても、非特許文献3に記載された技術のようなキーワードによる検索によれば、検索条件としての情報が不足することがある。 As a second problem, even if narrowing of the context ends, according to the search by keywords like technology described in Non-Patent Document 3, there may be insufficient information as a search condition. 例えば、「携帯+発見」といったキーワードで検索する場合、宝探しゲームのように携帯電話機で何かを発見するサービスや、携帯電話を発見するサービスを発見するサービスの情報の両方がキーワード検索結果に現れる。 For example, if you want to search by keyword such as "mobile + discovery", services and to discover something on a mobile phone as a treasure hunt game, both of the information of the service to discover the service to discover the mobile phone appears in the keyword search results . このため、回答精度を現状以上に向上させることが難しい。 Therefore, it is difficult to improve the answer accuracy than the current situation.

第1の課題に対して、本発明によれば、差分キーワードの単純な提示ではなく、動詞を中心に主語や目的語等の関係をリンクで表す「述語項構造」と呼ばれるデータから自然な応対の文章を生成し、それを利用者に提示する手法を用いることで理解度が深まることが期待できる。 With respect to the first object, according to the present invention, rather than a simple presentation of the difference keywords, natural answering the data called "predicate argument structure" which represents the link center subject or a relationship object such as a verb of the sentence to generate, it is expected that the level of understanding deepens by using a technique that presents it to the user. 例えば、「携帯+紛失」のユーザクエリに対して従来システムが「安心+申し込み」もしくは、「発見」といったキーワードを提示していたのに対し、「端末を紛失した際に安心できる申し込みに関する情報」もしくは「携帯電話を紛失した際に端末を発見すること」といった自然な文章をユーザに提示することでユーザの利便性を向上させる手段を提供する。 For example, a conventional system to the user query of "mobile + lost" is or "peace of mind + application", whereas had presented a keyword such as "discovery", "information about the application that can be peace of mind when you lose your terminal" or to provide a means for improving the convenience of the user by presenting a natural sentence such as "to discover the terminal when you lose your mobile phone" to the user.

第2の課題に対して、本発明によれば、述語項構造を検索パラメータとして知識源のテキストを検索することにより、コンテキスト絞り込み後の検索精度を大きく向上させる。 With respect to the second problem, according to the present invention, by searching the text of the knowledge source predicate argument structure as a search parameter, greatly improve search accuracy after context refinement. 例えば、「端末を発見する」と「端末で発見する」の意味を区別できる述語項構造を用いるので、従来型のキーワード検索で行われていた過剰検出が減る。 For example, since the use of the predicate terms structure that can distinguish the meaning of "finding a terminal" a "found at the terminal", reduces the excess detection was done in a conventional keyword search.

また、述語項構造を使用して文書の類似性を判定する場合、抽出した述語項構造の一致度合いを判定する必要があり、従来のキーワードを利用した場合より多くの計算時間が必要となることも問題となる。 Further, when determining the similarity of the document using the predicate argument structure, it is necessary to determine the degree of matching the extracted predicate argument structure, the more computation time than when using a conventional keyword is required also a problem. この問題に対しては、述語項構造の中で格と呼ばれるデータスロットに注目し、使用頻度が高いスロットの組み合わせを事例から事前に学習しておき、使用頻度の高い組み合わせに対してはハッシュ関数を使って高速に検索できるようにする。 For this problem, attention to data slots called rated in predicate argument structure in advance by learning in advance a combination of frequently used slots from the case, the hash function to a combination frequently used use the to be able to search at a high speed.

前述した本発明の種々の実施形態について、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。 For various embodiments of the present invention described above, various modifications of the technical scope and the scope of the present invention, modifications and omissions can be easily performed by those skilled in the art. 前述の説明はあくまで例であって、何ら制約しようとするものではない。 The foregoing description is merely an example, not intended to be any restrictions. 本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。 The present invention is limited only to limiting as the scope of the appended claims and their equivalents.

1 質問回答サーバ 10 通信インタフェース部 101 回答文蓄積部 102 コメント文章蓄積部 111 回答文取得部 112 コメント文章収集部 121 質問文入力部 122 質問キーワード抽出部 123 コメント文章検索部 124 トピック分類部 125 回答文検出部 126 代表述語項構造抽出部 127 差分述語項構造抽出部 128 差分述語項構造選択部 129 回答文出力部 2 回答文蓄積サーバ 3 ブログサーバ 4 端末 5 コメント投稿者用の汎用端末 1 question answering server 10 communication interface unit 101 reply sentence storage section 102 Comments sentence storage section 111 reply sentence obtaining unit 112 Comments sentence acquisition unit 121 question input unit 122 questions keyword extraction section 123 Comments sentence searching unit 124 topic classification unit 125 reply sentence generic terminal of detector 126 representative predicate argument structure extraction unit 127 difference predicate argument structure extraction unit 128 difference predicate argument structure selection unit 129 reply sentence output section 2 reply sentence storage server 3 blog server for 4 terminal 5 comments By

Claims (10)

  1. 多数のコメント文章を蓄積したコメント文章蓄積部と、多数の回答文を蓄積した回答文蓄積部とを有し、ユーザからの質問文に対する回答文を抽出するようにコンピュータを機能させる質問回答プログラムであって、 A number of comments sentences were accumulated comment sentence storage unit, and a plurality of answer sentence answer sentence accumulation unit that accumulates and a question answer a program that causes a computer to extract the answer message to the question sentence from the user there,
    質問文を入力する質問文入力手段と、 And the question text input means for inputting a question sentence,
    前記質問文に含まれる複数の質問キーワードを抽出する質問キーワード抽出手段と、 A question keyword extracting means for extracting a plurality of query keywords included in the question sentence,
    前記コメント文章蓄積部を用いて、前記質問キーワードを含むコメント文章を検索するコメント文章検索手段と、 Using the comment sentence storage unit, and comments text retrieval means for retrieving the comment sentence including the question keyword,
    検索された複数のコメント文章を、述語項構造解析によって、述語項構造の分布から複数個のトピックグループに分類するトピック分類手段と、 A plurality of comment sentences retrieved, by predicate argument structure analysis, the topic classification means for classifying the distribution of predicate argument structure into a plurality of topic group,
    各トピックグループに含まれるコメント文章群と、各回答文に含まれる文章との間の類似度を算出し、各トピックグループに前記類似度が所定閾値以上となる回答文を対応付ける回答文検出手段と、 And comments sentence group included in each topic group, calculates the degree of similarity between the text contained in each reply sentence, the answer sentence detection means for associating the reply sentence the similarity to each topic group is equal to or greater than a predetermined threshold value ,
    各トピックグループについて、対応付けられた回答文に含まれる述語項構造の中で、当該トピックグループを特徴付ける代表述語項構造を抽出する代表述語項構造抽出手段と、 For each topic group, in the predicate argument structure contained in the associated reply sentence, the representative predicate argument structure extraction means for extracting a representative predicate argument structure that characterizes the topic group,
    各トピックグループについて、当該トピックグループのみに出現する代表述語項構造を、差分述語項構造として抽出する差分述語項構造抽出手段と、 For each topic group, the representative predicate argument structure appearing only to the topic group, the difference predicate argument structure extraction means for extracting a difference predicate argument structure,
    前記回答文検出手段によって検出された前記回答文を、対応する1つ以上の前記差分述語項構造に基づく文章と共に明示する回答文出力手段としてコンピュータを機能させることを特徴とする質問回答プログラム。 Question Response program, characterized in that the answer message detected by the answer message detecting means, causes the computer to function as the corresponding one or more of said difference predicate argument demonstrates reply sentence output means together with text-based structure.
  2. 複数の前記差分述語項構造に基づく文章を、ユーザインタフェースを介してユーザに明示すると共に、ユーザ操作に応じていずれか1つの差分述語項構造を選択させる差分述語項構造選択手段を更に有し、 Sentences based on a plurality of the difference predicate argument structure, with clearly to the user via the user interface further includes a differential predicate argument structure selection means for selecting any one differential predicate argument structure in response to a user operation,
    前記回答文出力手段は、選択された文章の差分述語項構造に対応する回答文を、ユーザインタフェースを介して明示するようにコンピュータを機能させることを特徴とする請求項1に記載の質問回答プログラム。 The answer message output means, a reply sentence corresponding to the difference predicate argument structure of the selected text, answer questions program according to claim 1, characterized by causing a computer to function as best via the user interface .
  3. 前記トピック分類手段は、当該コメント文章を、分類された各トピックグループに属する確からしさ(トピック比率)を算出するLDA(Latent Dirichlet Allocation)アルゴリズムを用いて、いずれか1つのトピックグループに分類するようにコンピュータを機能させることを特徴とする請求項1又は2に記載の質問回答プログラム。 The topic classification means, the comment sentence, the likelihood belonging classified each topic groups were using LDA (Latent Dirichlet Allocation) algorithm for computing (topics ratio), to classify any one topic group question answer program according to claim 1 or 2, characterized in that causes a computer to function.
  4. 前記回答文検出手段は、 The answer sentence detection means,
    各トピックグループに含まれるコメント文章群から、述語項構造解析によって述語項構造を抽出すると共に、前記トピックグループにおける第1の特徴ベクトルを算出し、 From the comment sentence group included in each topic group, it extracts the predicate argument structure by predicate argument structure analysis, calculating a first feature vector in the topic group,
    前記回答文蓄積部に蓄積された各回答文から、述語項構造解析によって述語項構造を抽出すると共に当該回答文における第2の特徴ベクトルとを算出し、 The answers from the answer message stored in the sentence storage unit, calculates a second feature vector in the answer message extracts the predicate argument structure by predicate argument structure analysis,
    前記トピックグループの第1のベクトルと、前記回答文の第2のベクトルとの間のコサイン距離に基づいて類似度を算出するようにコンピュータを機能させることを特徴とする請求項1から3のいずれか1項に記載の質問回答プログラム。 A first vector of said topic group, any of claims 1 to 3, characterized in that causes a computer to function so as to calculate the similarity based on the cosine distance between the second vector of said answer message question answer program described in (1).
  5. 前記代表述語項構造抽出手段は、各トピックグループの代表述語項構造を、赤池情報量基準に応じて優先順に並べるようにコンピュータを機能させることを特徴とする請求項1から4のいずれか1項に記載の質問回答プログラム。 The representative predicate argument structure extraction means, a representative predicate argument structure of each topic group, any one of 4 the preceding claims, characterized in that causes a computer to function as arranged in order of priority in accordance with the Akaike Information Criterion question Answer program according to.
  6. 前記コメント文章は、不特定多数の第三者によって投稿されたものであって、 The comment sentence, which has been posted by an unspecified number of third parties,
    前記コメント文章蓄積部は、ミニブログ(mini Web log)サーバに投稿されたコメント文章を収集し蓄積したものであるようにコンピュータを機能させることを特徴とする請求項1から5のいずれか1項に記載の質問回答プログラム。 The comment sentence storage section, mini blog (mini Web log) any one of claims 1 to 5, characterized in that causes a computer to function as those collected accumulated comment text posted on the server question Answer program according to.
  7. 多数のコメント文章を蓄積したコメント文章蓄積部と、多数の回答文を蓄積した回答文蓄積部とを有し、ユーザからの質問文に対する回答文を抽出する質問回答サーバであって、 A number of comments sentences were accumulated comment sentence storage unit, and a plurality of answer sentence answer sentence accumulation unit that accumulates and a question answering server to extract the answer message to the question sentence from the user,
    端末から、質問文を入力する質問文入力手段と、 From the terminal, and the question text input means for inputting a question sentence,
    前記質問文に含まれる複数の質問キーワードを抽出する質問キーワード抽出手段と、 A question keyword extracting means for extracting a plurality of query keywords included in the question sentence,
    前記コメント文章蓄積部を用いて、前記質問キーワードを含むコメント文章を検索するコメント文章検索手段と、 Using the comment sentence storage unit, and comments text retrieval means for retrieving the comment sentence including the question keyword,
    検索された複数のコメント文章を、述語項構造解析によって、述語項構造の分布から複数個のトピックグループに分類するトピック分類手段と、 A plurality of comment sentences retrieved, by predicate argument structure analysis, the topic classification means for classifying the distribution of predicate argument structure into a plurality of topic group,
    各トピックグループに含まれるコメント文章群と、各回答文との間の類似度を算出し、各トピックグループに前記類似度が所定閾値以上となる回答文を対応付ける回答文検出手段と、 And comments sentence group included in each topic group, the similarity is calculated, and the degree of similarity to each topic group and answer message detecting means for associating the reply sentence equal to or greater than a predetermined threshold value between each answer sentence,
    各トピックグループについて、対応付けられた回答文に含まれる述語項構造の中で、当該トピックグループを特徴付ける代表述語項構造を抽出する代表述語項構造抽出手段と、 For each topic group, in the predicate argument structure contained in the associated reply sentence, the representative predicate argument structure extraction means for extracting a representative predicate argument structure that characterizes the topic group,
    各トピックグループについて、当該トピックグループのみに出現する代表述語項構造を、差分述語項構造として抽出する差分述語項構造抽出手段と、 For each topic group, the representative predicate argument structure appearing only to the topic group, the difference predicate argument structure extraction means for extracting a difference predicate argument structure,
    前記回答文検出手段によって検出された前記回答文を、対応する1つ以上の前記差分述語項構造に基づく文章と共に明示する回答文出力手段とを有することを特徴とする質問回答サーバ。 Question answer server characterized in that it comprises a said reply the answer message which is detected by the sentence detection means, corresponding one or more of the difference predicate argument demonstrates reply sentence output means together with text-based structure.
  8. 複数の前記差分述語項構造に基づく文章を、ユーザインタフェースを介してユーザに明示すると共に、ユーザ操作に応じていずれか1つの差分述語項構造を選択させる差分述語項構造選択手段を更に有し、 Sentences based on a plurality of the difference predicate argument structure, with clearly to the user via the user interface further includes a differential predicate argument structure selection means for selecting any one differential predicate argument structure in response to a user operation,
    前記回答文出力手段は、選択された文章の差分述語項構造に対応する回答文を、ユーザインタフェースを介して明示することを特徴とする請求項7に記載の質問回答サーバ。 The answer message output means, question answering server according to claim 7, characterized in that the answer message corresponding to the difference predicate argument structure of the selected sentence explicitly via a user interface.
  9. 多数のコメント文章を蓄積したコメント文章蓄積部と、多数の回答文を蓄積した回答文蓄積部とを有し、ユーザからの質問文に対する回答文を抽出する装置における質問回答方法であって、 A number of comments sentences were accumulated comment sentence storage unit, and a plurality of answer sentence answer sentence accumulation unit that accumulates and a question-and-answer method in an apparatus for extracting an answer sentence to the question sentence from the user,
    質問文を入力する第1のステップと、 And the first step to enter the question,
    前記質問文に含まれる複数の質問キーワードを抽出する第2のステップと、 A second step of extracting a plurality of query keywords included in the question sentence,
    前記コメント文章蓄積部を用いて、前記質問キーワードを含むコメント文章を検索する第3のステップと、 Using the comment sentence storage section, a third step of retrieving a comment sentence including the question keyword,
    検索された複数のコメント文章を、述語項構造解析によって、述語項構造の分布から複数個のトピックグループに分類する第4のステップと、 A plurality of comment sentences retrieved, by predicate argument structure analysis, a fourth step of classifying the distribution of predicate argument structure into a plurality of topic group,
    各トピックグループに含まれるコメント文章群と、各回答文との間の類似度を算出し、各トピックグループに前記類似度が所定閾値以上となる回答文を対応付ける第5のステップと、 And comments sentence group included in each topic group, the fifth step of calculating a similarity between each answer sentence associates reply sentence the similarity to each topic group is equal to or greater than a predetermined threshold value,
    各トピックグループについて、対応付けられた回答文に含まれる述語項構造の中で、当該トピックグループを特徴付ける代表述語項構造を抽出する第6のステップと、 For each topic group, in the predicate argument structure contained in reply sentence associated with, a sixth step of extracting a representative predicate argument structure that characterizes the topic group,
    各トピックグループについて、当該トピックグループのみに出現する代表述語項構造を、差分述語項構造として抽出する第7のステップと、 For each topic group, a seventh step of extracting a representative predicate argument structure appearing only to the topic group, the difference predicate argument structure,
    第5のステップによって検出された前記回答文を、対応する1つ以上の前記差分述語項構造に基づく文章と共に明示する第8のステップとを有することを特徴とする質問回答方法。 Question answer method characterized by having said answer message detected by the fifth step, an eighth step demonstrates with text based on a corresponding one or more of the difference predicate-argument structures.
  10. 第8のステップについて、 The steps of the eighth,
    複数の前記差分述語項構造に基づく文章を、ユーザインタフェースを介してユーザに明示すると共に、ユーザ操作に応じていずれか1つの差分述語項構造を選択させ、 Sentences based on a plurality of the difference predicate argument structure, with clearly to the user via the user interface, to select one of the differential predicate argument structure in response to a user operation,
    選択された文章の差分述語項構造に対応する回答文を、ユーザインタフェースを介して明示することを特徴とする請求項9に記載の質問回答方法。 Question answer method of claim 9, a reply sentence corresponding to the difference predicate argument structure of the selected text, characterized in that it explicitly through a user interface.
JP2012266589A 2012-12-05 2012-12-05 Question Answer program using a large amount of comment sentence, server and method Active JP6007088B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012266589A JP6007088B2 (en) 2012-12-05 2012-12-05 Question Answer program using a large amount of comment sentence, server and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012266589A JP6007088B2 (en) 2012-12-05 2012-12-05 Question Answer program using a large amount of comment sentence, server and method

Publications (2)

Publication Number Publication Date
JP2014112316A true true JP2014112316A (en) 2014-06-19
JP6007088B2 JP6007088B2 (en) 2016-10-12

Family

ID=51169410

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012266589A Active JP6007088B2 (en) 2012-12-05 2012-12-05 Question Answer program using a large amount of comment sentence, server and method

Country Status (1)

Country Link
JP (1) JP6007088B2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102015210047A1 (en) 2014-05-30 2015-12-03 Semiconductor Energy Laboratory Co., Ltd. touchscreen
JP2016115294A (en) * 2014-12-18 2016-06-23 バイドゥ ネットコム サイエンス アンド テクノロジー(ペキン) カンパニー リミテッド Information retrieval method and device
US9785672B2 (en) 2014-04-10 2017-10-10 Beijing Baidu Netcom Science And Technology Co., Ltd. Information searching method and device

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007141090A (en) * 2005-11-21 2007-06-07 Fuji Xerox Co Ltd Question answering system, data retrieval method and computer program
US20070136246A1 (en) * 2005-11-30 2007-06-14 At&T Corp. Answer determination for natural language questioning
JP2007241794A (en) * 2006-03-10 2007-09-20 Nara Institute Of Science & Technology Information search device by multisense word and program
JP2009043263A (en) * 2007-08-10 2009-02-26 Nhn Corp Question classification method and its system

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007141090A (en) * 2005-11-21 2007-06-07 Fuji Xerox Co Ltd Question answering system, data retrieval method and computer program
US20070136246A1 (en) * 2005-11-30 2007-06-14 At&T Corp. Answer determination for natural language questioning
JP2007241794A (en) * 2006-03-10 2007-09-20 Nara Institute Of Science & Technology Information search device by multisense word and program
JP2009043263A (en) * 2007-08-10 2009-02-26 Nhn Corp Question classification method and its system

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JPN6016031993; 落合 恵理香,他: '"商品の評価を対象としたレビュー文書の分析"' 言語処理学会第18回年次大会発表論文集 チュートリアル 本会議[CD-ROM] , 20120313, p.1176-1179, 言語処理学会 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9785672B2 (en) 2014-04-10 2017-10-10 Beijing Baidu Netcom Science And Technology Co., Ltd. Information searching method and device
DE102015210047A1 (en) 2014-05-30 2015-12-03 Semiconductor Energy Laboratory Co., Ltd. touchscreen
JP2016115294A (en) * 2014-12-18 2016-06-23 バイドゥ ネットコム サイエンス アンド テクノロジー(ペキン) カンパニー リミテッド Information retrieval method and device

Also Published As

Publication number Publication date Type
JP6007088B2 (en) 2016-10-12 grant

Similar Documents

Publication Publication Date Title
Aiello et al. Sensing trending topics in Twitter
Malouf et al. Taking sides: User classification for informal online political discourse
Hachey et al. Evaluating entity linking with Wikipedia
US8010545B2 (en) System and method for providing a topic-directed search
Hai et al. Identifying features in opinion mining via intrinsic and extrinsic domain relevance
Baroni et al. The WaCky wide web: a collection of very large linguistically processed web-crawled corpora
Lieberman et al. STEWARD: architecture of a spatio-textual search engine
US20090193011A1 (en) Phrase Based Snippet Generation
US20100050118A1 (en) System and method for evaluating sentiment
US20070022099A1 (en) Question answering system, data search method, and computer program
US20090070322A1 (en) Browsing knowledge on the basis of semantic relations
US20100185691A1 (en) Scalable semi-structured named entity detection
US20070185859A1 (en) Novel systems and methods for performing contextual information retrieval
US20090144609A1 (en) NLP-based entity recognition and disambiguation
US20140344230A1 (en) Methods and systems for node and link identification
US20110106807A1 (en) Systems and methods for information integration through context-based entity disambiguation
Rizzo et al. Nerd: evaluating named entity recognition tools in the web of data
US20070192309A1 (en) Method and system for identifying sentence boundaries
US20110113095A1 (en) System and Method For Value Significance Evaluation of Ontological Subjects of Networks and The Applications Thereof
Shen et al. Linden: linking named entities with knowledge base via semantic knowledge
US20090265338A1 (en) Contextual ranking of keywords using click data
Kang et al. based measurement of customer satisfaction in mobile service: Sentiment analysis and VIKOR approach
Gokulakrishnan et al. Opinion mining and sentiment analysis on a twitter data stream
Ozdikis et al. Semantic expansion of tweet contents for enhanced event detection in twitter
US20140074886A1 (en) Taxonomy Generator

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150804

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160819

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160912

R150 Certificate of patent or registration of utility model

Ref document number: 6007088

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150