JP6543283B2 - Passage type question answering device, method and program - Google Patents

Passage type question answering device, method and program Download PDF

Info

Publication number
JP6543283B2
JP6543283B2 JP2017018662A JP2017018662A JP6543283B2 JP 6543283 B2 JP6543283 B2 JP 6543283B2 JP 2017018662 A JP2017018662 A JP 2017018662A JP 2017018662 A JP2017018662 A JP 2017018662A JP 6543283 B2 JP6543283 B2 JP 6543283B2
Authority
JP
Japan
Prior art keywords
passage
similarity
question sentence
vector
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017018662A
Other languages
Japanese (ja)
Other versions
JP2018124914A (en
Inventor
幸徳 本間
幸徳 本間
九月 貞光
九月 貞光
京介 西田
京介 西田
東中 竜一郎
竜一郎 東中
久子 浅野
久子 浅野
松尾 義博
義博 松尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2017018662A priority Critical patent/JP6543283B2/en
Publication of JP2018124914A publication Critical patent/JP2018124914A/en
Application granted granted Critical
Publication of JP6543283B2 publication Critical patent/JP6543283B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、パッセージ型質問応答装置、方法、及びプログラムに係り、特に、質問に関連する内容を持つパッセージを回答として出力するためのパッセージ型質問応答装置、方法、及びプログラムに関する。   The present invention relates to a passage type question answering apparatus, method, and program, and more particularly, to a passage type question answering apparatus, method, and program for outputting a passage having contents related to a question as an answer.

インターネット上に大量のテキストデータが利用可能になっており、文書から必要な知識を検索する技術の重要性が高まっている。特定の文書に関する文書検索においては、ユーザの入力した検索要求と関連の高い文書の一部分を取り出して類似度を計算するパッセージレベルの検索が求められている。ここでパッセージとは、文書中で検索要求の内容と強く関連する内容を持つ任意の範囲のテキスト部を示す。   As a large amount of text data is available on the Internet, the importance of techniques for retrieving the necessary knowledge from documents is increasing. In the document search for a specific document, a passage level search is required which takes out a part of the document highly relevant to the search request input by the user and calculates the degree of similarity. Here, a passage indicates a text portion in an arbitrary range having content strongly related to the content of a search request in a document.

パッセージレベルの検索においては、どのようにパッセージを決定するかという問題が発生する。単に連続した一部分のテキストを抽出するのでは十分でなく、ユーザの検索要求と強く関連する内容を持つ意味的なまとまりを形成する必要がある。また、検索要求によって求める情報の粒度が異なるという検索の性質から、パッセージ検索は、検索要求が入力された時点で検索要求に応じて動的に計算される方が望ましい。さらに、検索要求に関連するまとまりがすべての文書・検索要求に対して一定のサイズであるとは考えづらく、パッセージのサイズが検索要求や文書に応じて可変に設定されるとよい。   In the passage level search, there arises the problem of how to determine the passage. It is not enough to simply extract a portion of the text, but it is necessary to form a semantic grouping with content that is strongly associated with the user's search request. In addition, it is desirable that passage search be dynamically calculated in response to a search request when the search request is input, since the granularity of the information to be obtained varies depending on the search request. Furthermore, it is hard to think that a group related to a search request has a fixed size for all document / search requests, and the size of passage may be variably set according to the search request and the document.

検索要求が複数の語からなるクエリで表現されるときに、クエリの語彙を用いて文書中の語彙的連鎖を用いてパッセージを決定する手法があり、例えば非特許文献1に記載の手法などがある。ここで、語彙的連鎖とは、意味的に関連のある語の連続のことをいう。   When a search request is expressed by a query consisting of a plurality of words, there is a method of determining passage using a lexical chain in a document using the vocabulary of the query. For example, the method described in Non-Patent Document 1 etc. is there. Here, the lexical chain refers to a series of semantically related words.

望月源, 岩山真 and 奥村学. 語彙的連鎖に基づくパッセージ検索. 自然言語処理, 1999, 101-126.Mochizuki source, Makoto Iwayama and Osamu Okumura. Passage search based on lexical chain. Natural language processing, 1999, 101-126.

Web上の商品マニュアル等の階層的な構造を持つ文書と、当該文書に対する自然文からなる質問の回答を生成する問題を考える。例として、図1に、ある保険商品に関する説明文書の一部を示す。図1では、当該説明文書に対する、質問「原動機付自転車の補償対象は?」の回答として望ましいパッセージを下線として例を示している。   Consider the problem of generating a document having a hierarchical structure such as a product manual on the Web and a question answer consisting of natural sentences for the document. As an example, FIG. 1 shows part of an explanatory document on a certain insurance product. FIG. 1 shows an example in which a desirable passage is underlined as an answer to the question "What is the object of compensation for a motor bike?"

質問中の名詞や形容詞・副詞などをクエリとしてみなすことで、非特許文献1などの手法を用いることが出来るが、非特許文献1に開示されている手法は連続した文集合をパッセージとして抽出する手法であり、図1に示す例のように、連続していない文集合からなるパッセージを回答候補として扱うことは難しい。また、非特許文献1の手法は語彙的連鎖を用いてパッセージを決定しているため、図1に示す例の文「原動機付自転車自体に生じた損害は補償外です。」と文「借用中の原動機付自転車事故も補償の対象となります。」のように、「原動機付自転車」や「補償」といった共通した単語を含む文同士を誤って一つのパッセージとして抽出する場合がある。これらの文の意味が異なることを理解するためには、単語の語彙を考慮するだけでなく、複数の単語や特定のフレーズなどの言語的に深い意味を考慮する必要がある。   By considering nouns, adjectives, adverbs, etc. in a query as a query, methods such as Non-Patent Document 1 can be used, but the method disclosed in Non-Patent Document 1 extracts a continuous sentence set as a passage. This is a method, and it is difficult to handle passages consisting of non-consecutive sentence sets as answer candidates as in the example shown in FIG. In addition, since the method of Non-Patent Document 1 determines passage using a lexical chain, the example sentence shown in FIG. 1 "damage caused to the motorbike itself is out of compensation" and the sentence "during borrowing "Motorized bicycle accident of is also the subject of compensation.", Sentences containing common words such as "motorized bicycle" and "compensation" may be mistakenly extracted as one passage. In order to understand that these sentences have different meanings, it is necessary to consider not only the vocabulary of words but also linguistically deep meanings such as plural words and specific phrases.

本発明は、上記事情を鑑みて成されたものであり、質問文に対する回答として適切なパッセージを出力することができるパッセージ型質問応答装置、方法、及びプログラムを提供することを目的とする。   The present invention has been made in view of the above circumstances, and it is an object of the present invention to provide a passage type question answering apparatus, method, and program capable of outputting an appropriate passage as a response to a question sentence.

上記目的を達成するために、第1の発明に係るパッセージ型質問応答装置は、一つ以上の階層的な構造を持つ文書と、前記文書に対する質問文とが与えられたときに、前記文書に含まれる、前記質問文に関連するテキストの範囲であるパッセージを、前記質問文の回答として出力するパッセージ型質問応答装置であって、前記質問文の係り受け構造を考慮した質問文ベクトルを算出する質問文ベクトル算出部と、前記文書に含まれる各文を、回答候補となる各パッセージの初期値とし、前記文書の構造及び文をノードとする木構造に基づいて、前記回答候補となるパッセージの各々について、前記パッセージを表す部分木とのノード間の距離が予め定められた距離以下となる文の各々を含むように前記パッセージを表す部分木を各々拡張していくことで、前記回答候補となるパッセージを検索するパッセージ検索部と、前記検索された回答候補となる前記パッセージの各々を表すパッセージベクトルと、前記質問文ベクトルとの組み合わせの各々についての類似度を算出する類似度算出部と、予め定められた終了条件を満たすまで前記パッセージ検索部、及び前記類似度算出部の処理を繰り返させる終了判定部と、前記組み合わせの各々の類似度に基づいて、前記質問文の回答となる前記パッセージを出力する検索結果出力部と、を含んで構成されている。   In order to achieve the above object, a passage type question answering device according to a first aspect of the present invention is characterized in that, when a document having one or more hierarchical structures and a question sentence for the document are given, A passage type question answering apparatus that outputs, as a response to the question sentence, a passage that is included in a range of text related to the question sentence, and calculates a question sentence vector in consideration of a dependency structure of the question sentence A question sentence vector calculation unit, and each sentence included in the document is set as an initial value of each passage serving as an answer candidate, and based on the structure of the document and a tree structure having a sentence as a node, the passage candidate serving as the answer candidate Each of the subtrees representing the passage is extended so that each of the sentences includes a sentence in which the distance between the node and the subtree representing the passage is less than or equal to a predetermined distance. And the similarity of each of the combination of the passage search unit for searching the passage as the answer candidate, the passage vector representing each of the passages as the answer candidate searched, and the question sentence vector Based on the similarity of each of the combinations, the similarity calculation unit to be calculated, the passage search unit until completion of a predetermined end condition, and an end judgment unit that causes the processing of the similarity calculation unit to be repeated. And a search result output unit that outputs the passage serving as the answer to the question sentence.

また、第1の発明に係るパッセージ型質問応答装置において、前記類似度算出部は、前記パッセージを拡張していく過程において、前記算出された、拡張された後の前記パッセージを表すパッセージベクトルと、前記質問文ベクトルとの組合せに関する類似度が、拡張される前の前記パッセージを表すパッセージベクトルと、前記質問文ベクトルとの組合せに関する類似度以下である場合には、前記拡張された後の前記パッセージを拡張の対象から削除するようにしてもよい。   In the passage type question answering device according to the first aspect of the invention, the similarity calculation unit further includes, in the process of expanding the passage, the passage vector representing the passage after being expanded. If the similarity of the combination with the question sentence vector is less than the similarity of the passage vector representing the passage before being expanded and the combination of the question sentence vector, the passage after the expansion May be deleted from the target of expansion.

第2の発明に係るパッセージ型質問応答方法は、一つ以上の階層的な構造を持つ文書と、前記文書に対する質問文とが与えられたときに、前記文書に含まれる、前記質問文に関連するテキストの範囲であるパッセージを、前記質問文の回答として出力するパッセージ型質問応答装置におけるパッセージ型質問応答方法であって、質問文ベクトル算出部が、前記質問文の係り受け構造を考慮した質問文ベクトルを算出するステップと、パッセージ検索部が、前記文書に含まれる各文を、各パッセージとするパッセージ集合の初期値とし、前記文書の構造及び文をノードとする木構造に基づいて、前記パッセージ集合におけるパッセージの各々について、前記パッセージを表す部分木とのノード間の距離が予め定められた距離以下となる文の各々を含むように前記パッセージを表す部分木を各々拡張していくことで、回答候補となる前記パッセージを検索するステップと、類似度算出部が、前記検索された回答候補となる前記パッセージの各々を表すパッセージベクトルと、前記質問文ベクトルとの組み合わせの各々についての類似度を算出するステップと、終了判定部が、予め定められた終了条件を満たすまで前記パッセージ検索部、及び前記類似度算出部の処理を繰り返させるステップと、検索結果出力部が、前記組み合わせの各々の類似度に基づいて、前記質問文の回答となる前記パッセージを出力するステップと、を含んで実行することを特徴とする。   In a passage type question answering method according to a second aspect of the invention, when a document having one or more hierarchical structures and a question sentence for the document are given, the question matter related to the question sentence included in the document is provided. A passage type question answering method in a passage type question answering apparatus, which outputs a passage that is a range of text to be answered as the answer to the question sentence, wherein the question sentence vector calculating unit calculates the question considering the dependency structure of the question sentence Calculating a sentence vector, the passage retrieval unit taking each sentence included in the document as an initial value of a passage set as each passage, and based on the structure of the document and the tree structure using the sentence as a node For each passage in the passage set, each of the sentences whose distance between nodes with the subtree representing the passage is less than or equal to a predetermined distance The subtree representing the passage is expanded so as to include the step, the step of searching for the passage serving as a response candidate, and the similarity calculation unit represents each of the passages serving as the retrieved response candidate. Calculating the degree of similarity for each combination of the passage vector and the question sentence vector, and processing by the passage search unit and the similarity calculation unit until the end determination unit satisfies a predetermined end condition And the step of outputting the passage serving as the answer to the question sentence based on the degree of similarity of each of the combinations.

また、第2の発明に係るパッセージ型質問応答方法において、前記類似度算出部が類似度を算出するステップにおいて、前記パッセージを拡張していく過程において、前記類似度算出部で算出された、拡張された後の前記パッセージを表すパッセージベクトルと、前記質問文ベクトルとの組合せに関する類似度が、拡張される前の前記パッセージを表すパッセージベクトルと、前記質問文ベクトルとの組合せに関する類似度以下である場合には、前記拡張された後の前記パッセージを拡張の対象から削除するようにしてもよい。   Further, in the passage type question answering method according to the second invention, in the step of the similarity calculating unit calculating the similarity, in the process of expanding the passage, the expansion calculated by the similarity calculating unit The degree of similarity regarding the combination of the passage vector representing the passage and the question sentence vector is less than or equal to the degree of similarity regarding the combination of the passage vector representing the passage before being expanded and the question sentence vector In this case, the passage after the expansion may be deleted from the target of expansion.

また、第3の発明に係るプログラムは、コンピュータを、第1の発明に係るパッセージ型質問応答装置の各部として機能させるためのプログラムである。   A program according to a third invention is a program for causing a computer to function as each part of the passage type question answering device according to the first invention.

本発明のパッセージ型質問応答装置、方法、及びプログラムによれば、文書に含まれる各文を、各パッセージとするパッセージ集合の初期値とし、木構造に基づいて、パッセージ集合におけるパッセージの各々について、パッセージを表す部分木とのノード間の距離が予め定められた距離以下となる文の各々を含むようにパッセージを表す部分木を各々拡張していくことで、回答候補となるパッセージを検索し、パッセージの各々を表すパッセージベクトルと、質問文ベクトルとの組み合わせの各々についての類似度を算出し、予め定められた終了条件を満たすまで検索及び類似度の算出の処理を繰り返させ、組み合わせの各々の類似度に基づいて、質問文の回答となるパッセージを出力することにより、質問文に対する回答として適切なパッセージを出力することができる、という効果が得られる。   According to the passage type question answering apparatus, method, and program of the present invention, each sentence included in the document is set as an initial value of a passage set as each passage, and for each passage in the passage set based on the tree structure Each passage subtree representing a passage is expanded so as to include each sentence in which the distance between nodes with the subtree representing the passage is equal to or less than a predetermined distance, and passages serving as answer candidates are retrieved. The similarity for each combination of the passage vector representing each passage and the question sentence vector is calculated, and the process of retrieval and calculation of similarity is repeated until a predetermined end condition is satisfied, and each combination By outputting a passage serving as the answer to the question sentence based on the degree of similarity, appropriate performance can be obtained as an answer to the question sentence It is possible to output a message, effect is obtained that.

保険商品に関する説明文書におけるパッセージの一例を示す図である。It is a figure which shows an example of the passage in the explanatory document regarding an insurance goods. 本発明の実施の形態に係るパッセージ型質問応答装置の構成を示すブロック図である。It is a block diagram which shows the structure of the passage type question answering apparatus which concerns on embodiment of this invention. 回答候補となるパッセージを検索し、パッセージと質問文との類似度の集合を算出するためのアルゴリズムの一例を示す図である。It is a figure which shows an example of the algorithm for searching the passage used as an answer candidate, and calculating the set of the similarity degree of a passage and a question sentence. 本発明の実施の形態に係るパッセージ型質問応答装置におけるパッセージ型質問応答処理ルーチンを示すフローチャートである。It is a flowchart which shows the passage type question answer processing routine in the passage type question answering apparatus which concerns on embodiment of this invention.

以下、図面を参照して本発明の実施の形態を詳細に説明する。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.

<本発明の実施の形態に係る概要> <Overview of Embodiment of the Present Invention>

まず、本発明の実施の形態における概要を説明する。   First, an outline of the embodiment of the present invention will be described.

本発明の実施の形態では、文書の階層的な構造を利用することで、文書に含まれる連続していない文集合を、質問文に関連するテキストの範囲であるパッセージとして扱う手法を用いる。文書の階層構造によっては回答となるパッセージの候補数が大きくなり計算コストが増大する場合があるため、本実施の形態では、効率的にパッセージの候補を走査する方法について述べる。また、文中の語彙のみを考慮する語彙的連鎖では誤ったパッセージを抽出する場合があるため、複数の単語やフレーズを考慮する意味的な連鎖を用いたパッセージ抽出手法を用いて、パッセージを、質問文の回答として出力する。   The embodiment of the present invention uses a hierarchical structure of a document to use a method of treating a non-consecutive sentence set included in a document as a passage which is a range of text related to a question sentence. Depending on the hierarchical structure of the document, the number of passage candidates to be answered may increase and the calculation cost may increase. Therefore, in this embodiment, a method for efficiently scanning passage candidates will be described. Also, since a lexical chain that considers only the vocabulary in a sentence may extract a false passage, a passage may be questioned using a passage extraction method using a semantic chain that considers multiple words and phrases. Output as a sentence answer.

<本発明の実施の形態に係るパッセージ型質問応答装置の構成> <Configuration of Passage Type Question Answering Apparatus According to Embodiment of the Present Invention>

次に、本発明の実施の形態に係るパッセージ型質問応答装置の構成について説明する。図2に示すように、本発明の実施の形態に係るパッセージ型質問応答装置100は、CPUと、RAMと、後述するパッセージ型質問応答処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することが出来る。このパッセージ型質問応答装置100は、機能的には図2に示すように入力部10と、演算部20とを備えている。   Next, the configuration of the passage type question answering apparatus according to the embodiment of the present invention will be described. As shown in FIG. 2, the passage type question answering apparatus 100 according to the embodiment of the present invention is a ROM storing a CPU, a RAM, a program for executing a passage type question answering process routine described later, and various data. And can be configured with a computer. This passage type question answering apparatus 100 functionally includes an input unit 10 and an operation unit 20 as shown in FIG.

入力部10は、自然言語からなる質問文を受け付ける。また、一つ以上のXML/HTML構造を持つ文書を受け付ける。   The input unit 10 receives a question sentence consisting of natural language. It also accepts documents with one or more XML / HTML structures.

演算部20は、質問文ベクトル算出部30と、パッセージ検索部32と、類似度算出部34と、終了条件判定部36と、検索結果出力部38とを含んで構成されている。   The calculation unit 20 includes a question sentence vector calculation unit 30, a passage search unit 32, a similarity calculation unit 34, an end condition determination unit 36, and a search result output unit 38.

質問文ベクトル算出部30は、入力部10で受け付けた質問文の係り受け構造を考慮した質問文ベクトルを算出する。ここでは、質問文の係り受け構造を考慮した上で、固定長の次元数Dを持つ質問文ベクトルを算出する。ベクトルの算出方法としては、非特許文献2に記載の方法を利用することができる。係り受けの解析として例えば非特許文献3に記載の方法を利用することができる。   The question sentence vector calculation unit 30 calculates a question sentence vector in consideration of the dependency structure of the question sentence accepted by the input unit 10. Here, in consideration of the dependency structure of the question sentence, a question sentence vector having a dimension number D of a fixed length is calculated. As a method of calculating the vector, the method described in Non-Patent Document 2 can be used. For example, the method described in Non-Patent Document 3 can be used as a dependency analysis.

[非特許文献2]:Richard Socher, Eric H Huang, Jeffrey Pennin Christopher D. Manning, Andrew Y Ng. Dynamic pooling and unfolding recursive autoencoders for paraphrase detection. Advances in Neural Information Processing Systems, pp. 801-809, 2011. [Non-patent document 2]: Richard Socher, Eric H Huang, Jeffrey Pennin Christopher D. Manning, Andrew Y Ng. Dynamic pooling and unfolding recursive autoencoders for paraphrase detection. Advances in Neural Information Processing Systems, pp. 801-809, 2011.

[非特許文献3]:Kenji Imamura, Genichiro Kikui and Norihito Yasuda. Japanese Dependency Parsing Using Sequential Labeling for Semi-spoken Language. In Proceedings of the 45th Annual Meeting of the Association for Computational Linguistics Companion Volume Proceedings of the Demo and Poster Sessions, pp. 225-228, 2007. [Non-patent document 3]: Kenji Imamura, Genichiro Kikui and Norihito Yasuda. Japanese Dependency Parsing Using Sequential Labeling for Semi-spoken Language. In Proceedings of the 45th Annual Meeting of the Association for Computational Linguistics Companion Volume Proceedings of the Demo and Poster Session Sessions Session Sessions , pp. 225-228, 2007.

パッセージ検索部32及び類似度算出部34は、例えば図3に示すアルゴリズムに従って、回答候補となるパッセージを検索し、パッセージと質問文との類似度の集合を算出する機能を担う。具体的な処理については後述する。   The passage searching unit 32 and the similarity calculating unit 34 have a function of searching for passages serving as answer candidates according to, for example, the algorithm shown in FIG. 3 and calculating a set of similarities between the passages and the question sentence. Specific processing will be described later.

パッセージ検索部32は、入力部10で受け付けた文書に含まれる各文を、回答候補となる各パッセージを表すパッセージリストWに格納して初期値とし、当該文書の構造及び文をノードとする木構造に基づいて、パッセージリストWにおけるパッセージの各々について、当該パッセージwを表す部分木とのノード間の距離が予め定められた距離L以下となる文の各々を含むようにパッセージを表す部分木を各々拡張していくことで、回答候補となるパッセージを検索する。   The passage retrieval unit 32 stores each sentence included in the document received by the input unit 10 in the passage list W representing each passage serving as an answer candidate, and uses it as an initial value, and a tree having the structure and sentence of the document as nodes. Based on the structure, for each passage in passage list W, a partial tree representing a passage such that each of the sentences whose distance between nodes with the partial tree representing the passage w is equal to or less than a predetermined distance L is included. Each is expanded to search for passages that become answer candidates.

パッセージ検索部32の具体的な処理を以下に説明する。パッセージ検索部32では、0個以上のパッセージからなるパッセージリストを受け取り、パッセージリストの更新を繰り返す処理を行う。ここで、各パッセージはXML/HTML構造のタグと文をノードとして持つ文書の部分木として表現される。図4に部分木の例を示す。   Specific processing of the passage retrieval unit 32 will be described below. The passage retrieval unit 32 receives a passage list consisting of zero or more passages, and performs a process of repeating the update of the passage list. Here, each passage is expressed as a subtree of a document having XML / HTML structured tags and sentences as nodes. FIG. 4 shows an example of a subtree.

まず、初期状態では、パッセージリストが空であるので、検索対象文書中のすべての文について、各文をノードとする木集合として初期化する。この段階では各文が各パッセージとなり、これを類似度算出部34に出力する。次に、類似度算出部34で更新されたパッセージリストWを受け取り、パッセージリストWが1つ以上の要素を含む場合、文書の構造及び文をノードとする木構造に基づいて、それぞれのパッセージの部分木wについて、同文書中の部分木wとのノード間距離がL以下の文sを含むように拡張した部分木wnewをパッセージリストに追加する。距離の計算では、部分木wに複数の文が含まれる場合には、当該複数の文の各々と文sとの距離のうち、最短の距離を、部分木wと文sとの距離とする。この時、同一の部分木が既にパッセージリストWに追加されている場合や、当該部分木の類似度が計算済みである場合はパッセージリストWへの追加は実施しない。また、パッセージwnewはメタデータとして拡張される前のパッセージwのパッセージベクトルと質問文ベクトルとの類似度cold情報を保持する。 First, since the passage list is empty in the initial state, all the sentences in the document to be searched are initialized as a tree set having each sentence as a node. At this stage, each sentence becomes each passage, which is output to the similarity calculation unit 34. Next, when the passage list W updated by the similarity calculation unit 34 is received and the passage list W includes one or more elements, the passage structure W of each passage is selected based on the document structure and the tree structure having the sentences as nodes. for the partial tree w, add an extended portion tree w new so that the node distance between the sub-tree w in the same document contains the following statement s L in the passage list. In the calculation of the distance, when a plurality of sentences are included in the subtree w, the shortest distance among the distances between each of the plurality of sentences and the sentence s is taken as the distance between the subtree w and the sentence s. . At this time, when the same subtree is already added to the passage list W, or when the similarity of the subtree is already calculated, the addition to the passage list W is not performed. In addition, passage w new holds similarity degree c old information of passage vector of passage w and question sentence vector before expanded as metadata.

類似度算出部34は、検索された回答候補となるパッセージの各々を表すパッセージベクトルと、質問文ベクトルとの組み合わせの各々についての類似度cを算出する。また、パッセージを拡張していく過程において、類似度算出部34で算出された、拡張された後のパッセージを表すパッセージベクトルと、質問文ベクトルとの組合せに関する類似度cが、拡張される前のパッセージを表すパッセージベクトルと、質問文ベクトルとの組合せに関する類似度cold以下である場合には、拡張された後のパッセージをパッセージリストWから削除し、拡張の対象から除外する。 The similarity calculation unit 34 calculates the similarity c for each combination of a passage vector representing each of the retrieved passage candidates and a question sentence vector. Also, in the process of expanding the passage, the similarity c related to the combination of the passage vector representing the passage after expansion, which is calculated by the similarity calculation unit 34, and the question sentence vector is not expanded. If the passage vector representing the passage and the degree of similarity c old with respect to the combination of the question sentence vector or less, the passage after being expanded is deleted from the passage list W and excluded from the object of the expansion.

類似度算出部34の具体的な処理を以下に説明する。類似度算出部34は、質問文ベクトル算出部30から与えられる質問文ベクトルと、パッセージ検索部32から与えられるパッセージリストWとを入力として、パッセージリストの各パッセージと質問文ベクトルと組み合わせの各々の類似度cを計算し、類似度cが付与されたパッセージ集合(P)を出力する。類似度計算においては、まず、パッセージのパッセージベクトルを算出する。パッセージベクトルは、上記非特許文献2に記載の方法等を用いて、パッセージが持つ文の係り受け木と文書構造木を考慮し、生成した各パッセージに対応するパッセージベクトルを算出すればよい。パッセージベクトルは質問文ベクトルと同様、固定長の次元数Dを持つベクトルである。次にパッセージについて算出したパッセージベクトルと、質問文ベクトルとのcos類似度を算出することで類似度cを求める。また、各パッセージについて事前に質問文と意味的に近しい等の知識を得ている場合は、パッセージベクトルと質問文ベクトルの類似度算出手法の学習を予め実施した結果を用いることができる。例えば非特許文献4などの手法で類似度算出手法を学習することが出来る。   Specific processing of the similarity calculation unit 34 will be described below. Similarity calculation unit 34 receives each question sentence vector given from question sentence vector calculation unit 30 and passage list W given from passage search unit 32 and inputs each passage in the passage list, each question sentence vector, and each combination. The similarity c is calculated, and a passage set (P) to which the similarity c is assigned is output. In similarity calculation, a passage vector is first calculated. The passage vector may be calculated using the method described in Non-Patent Document 2 above, taking into consideration the sentence dependency tree and the document structure tree possessed by the passage, and calculating the passage vector corresponding to each generated passage. The passage vector is a vector having a dimension number D of a fixed length, like the question sentence vector. Next, the similarity c is calculated by calculating the cos similarity between the passage vector calculated for the passage and the question sentence vector. In addition, in the case where knowledge such as that is semantically close to the question sentence is obtained in advance for each passage, it is possible to use the result of learning in advance the method of calculating the degree of similarity between passage vector and question sentence vector. For example, the similarity calculation method can be learned by the method of Non-Patent Document 4 or the like.

[非特許文献4]:Tai, Kai Sheng, Richard Socher, and Christopher D. Manning. Improved semantic representations from tree-structured long short-term memory networks. arXiv preprint arXiv:1503.00075, 2015. [Non-patent document 4]: Tai, Kai Sheng, Richard Socher, and Christopher D. Manning. Improved semantic representations from tree-structured long short-term memory networks. ArXiv preprint arXiv: 1503.00075, 2015.

また、類似度算出部34において、類似度cが類似度coldより小さい場合、当該パッセージをパッセージリストから削除する。入力されたパッセージリストWの各パッセージwについて類似度を算出した後、更新されたパッセージリストWと、類似度が付与されたパッセージ集合Pを、パッセージ検索部32及び終了条件判定部36に出力する。 Also, if the similarity c is smaller than the similarity c old , the similarity calculation unit 34 deletes the passage from the passage list. After calculating the degree of similarity for each passage w of the input passage list W, the updated passage list W and the passage set P to which the degree of similarity is given are output to the passage search unit 32 and the end condition determination unit 36 .

終了条件判定部36は、予め定められた終了条件を満たすまでパッセージ検索部32、及び類似度算出部34の処理を繰り返させる。   The termination condition determination unit 36 repeats the processing of the passage retrieval unit 32 and the similarity degree calculation unit 34 until a predetermined termination condition is satisfied.

終了条件としては、パッセージリストWの大きさが0、かつ、既に類似度cが付与されたパッセージ集合がある場合(P≠0)とする。終了条件判定部36は、終了条件を満たしたと判定した場合には、組み合わせの各々に類似度cが付与されたパッセージの集合Pを検索結果出力部38に出力する。   As the end condition, it is assumed that the size of the passage list W is 0 and there is a passage set to which the similarity c has already been assigned (P (0). If the end condition determination unit 36 determines that the end condition is satisfied, the end condition determination unit 36 outputs, to the search result output unit 38, a passage set P in which the similarity c is given to each of the combinations.

検索結果出力部38は、組み合わせの各々の類似度cに基づいて、質問文の回答となるパッセージを出力する。例えば、類似度cについて降順に並び替えた複数のパッセージを検索結果として出力・表示する。ここで、検索結果の見やすさのためにパッセージの個数や類似度の数値を閾値として表示するパッセージの個数を変更してもよい。また、各パッセージに対応する部分木に含まれる文を出力するだけでなく、検索対象の文書において当該パッセージの最上部と最下部に対応する文に挟まれる範囲の文集合を出力してもよい。この操作によって、ユーザは検索要求に直接関連する文だけでなく、関連する知識を得ることが出来る。   The search result output unit 38 outputs a passage serving as an answer to the question sentence based on the similarity c of each combination. For example, a plurality of passages sorted in descending order of similarity c are output and displayed as search results. Here, the number of passages or the number of passages displayed with the numerical value of the degree of similarity as a threshold may be changed in order to make the search results easy to read. In addition to outputting the sentences included in the subtree corresponding to each passage, a sentence set in a range between the sentences corresponding to the top and the bottom of the passage may be output in the document to be searched. . By this operation, the user can obtain not only sentences directly related to the search request but also related knowledge.

<本発明の実施の形態に係るパッセージ型質問応答装置の作用> <Operation of passage type question answering apparatus according to the embodiment of the present invention>

次に、本発明の実施の形態に係るパッセージ型質問応答装置100の作用について説明する。入力部10において自然言語からなる質問文、及び一つ以上のXML/HTML構造を持つ文書を受け付けると、パッセージ型質問応答装置100は、図4に示すパッセージ型質問応答処理ルーチンを実行する。   Next, the operation of the passage type question answering apparatus 100 according to the embodiment of the present invention will be described. When the input unit 10 receives a question sentence consisting of a natural language and a document having one or more XML / HTML structures, the passage type question answering apparatus 100 executes a passage type question answering process routine shown in FIG.

まず、ステップS100では、入力部10で受け付けた質問文の係り受け構造を考慮した質問文ベクトルを算出する。   First, in step S100, a question sentence vector is calculated in consideration of the dependency structure of the question sentence accepted by the input unit 10.

次に、ステップS102では、入力部10で受け付けた文書に含まれる各文を、回答候補となる各パッセージを表す初期値としてパッセージリストWを初期化する。   Next, in step S102, each sentence included in the document accepted by the input unit 10 is initialized to the passage list W as an initial value representing each passage serving as an answer candidate.

ステップS104では、ステップS102で初期化されたパッセージリストWに含まれるパッセージの各々を表すパッセージベクトルと、質問文ベクトルとの組み合わせの各々についての類似度cを算出する。   In step S104, the degree of similarity c is calculated for each combination of a passage vector representing each passage included in the passage list W initialized in step S102 and a question sentence vector.

ステップS106では、文書の構造及び文をノードとする木構造に基づいて、パッセージリストWにおけるパッセージの各々について、当該パッセージを表す部分木とのノード間の距離が予め定められた距離L以下となる文の各々を含むようにパッセージを表す部分木を各々拡張し、拡張したパッセージwnewをパッセージリストWに加えることで回答候補となるパッセージを検索する。 In step S106, for each passage in passage list W, the distance between nodes with the subtree representing the passage is equal to or less than a predetermined distance L based on the tree structure having the document structure and the sentence as nodes. Each subtree representing a passage is extended so as to include each of the sentences, and the extended passage w new is added to the passage list W to search for passages that become answer candidates.

ステップS108では、パッセージリストWに含まれるパッセージのうち、新たに拡張されたパッセージの各々を表すパッセージベクトルと、質問文ベクトルとの組み合わせの各々についての類似度cを算出する。また、拡張された後のパッセージを表すパッセージベクトルと、質問文ベクトルとの組合せに関する類似度cが、拡張される前のパッセージを表すパッセージベクトルと、質問文ベクトルとの組合せに関する類似度cold以下である場合には、拡張された後のパッセージをパッセージリストWから削除し、拡張の対象から除外する。 In step S108, among the passages included in the passage list W, the similarity c is calculated for each combination of a passage vector representing each of the newly expanded passages and the question sentence vector. Also, the similarity c for the combination of the passage vector representing the passage after expansion and the question sentence vector is less than the similarity c old for the combination of the passage vector representing the passage before expansion and the question sentence vector If so, the passage after being expanded is deleted from the passage list W and excluded from being expanded.

ステップS110では、パッセージリストWの大きさが0、かつ、既に類似度cが付与されたパッセージ集合があるかを終了条件として、終了条件を満たすか否かを判定し、終了条件を満たす場合にはステップS112へ移行し、終了条件を満たさない場合にはステップS106へ戻って処理を繰り返す。   In step S110, it is determined whether or not the end condition is satisfied, assuming that the size of the passage list W is 0 and there is a passage set to which the similarity c is already given as the end condition, and the end condition is satisfied. The process proceeds to step S112, and if the end condition is not satisfied, the process returns to step S106 to repeat the process.

ステップS112では、パッセージベクトルと、質問文ベクトルとの組み合わせの各々の類似度cに基づいて、質問文の回答となるパッセージを出力し、処理を終了する。   In step S112, a passage serving as an answer to the question sentence is output based on the degree of similarity c of each combination of the passage vector and the question sentence vector, and the process ends.

以上説明したように、本発明の実施の形態に係るパッセージ型質問応答装置によれば、文書に含まれる各文を、各パッセージとするパッセージ集合の初期値とし、木構造に基づいて、パッセージ集合におけるパッセージの各々について、パッセージを表す部分木とのノード間の距離が予め定められた距離以下となる文の各々を含むようにパッセージを表す部分木を各々拡張していくことで、回答候補となるパッセージを検索し、パッセージの各々を表すパッセージベクトルと、質問文ベクトルとの組み合わせの各々についての類似度を算出し、予め定められた終了条件を満たすまで検索及び類似度の算出の処理を繰り返させ、組み合わせの各々の類似度に基づいて、質問文の回答となるパッセージを出力することにより、質問文に対する回答として適切なパッセージを出力することができる。   As described above, according to the passage type question answering apparatus according to the embodiment of the present invention, each sentence included in the document is set as an initial value of a passage set as each passage, and the passage set is generated based on the tree structure. The answer candidate and the answer candidate are expanded by respectively expanding the subtree representing the passage so that the distance between the node and the subtree representing the passage is less than or equal to a predetermined distance for each passage in The passage which is obtained is searched, the similarity for each of the passage vector representing each passage and the combination of the question sentence vector is calculated, and the process of searching and calculating the similarity is repeated until the predetermined ending condition is satisfied. Answer the question sentence by outputting a passage that is the answer to the question sentence based on the similarity of each of the combinations It is possible to output the appropriate passages and.

また、検索要求に対して構造的な文書を検索する際に、文書の構造的な情報を利用して回答候補となるパッセージの候補を動的に探索・評価することで、検索要求に対して、一つのパッセージとしてサイズが可変かつ連続していない文集合を出力することが可能となる。   In addition, when searching for a structural document in response to a search request, the search request is evaluated by dynamically searching for and evaluating passage candidates as answer candidates using structural information on the document. As a passage, it is possible to output a variable and non-consecutive sentence set.

また、質問文とパッセージ間の類似度を計算する際に、文の係り受け情報や文書構造・単語の分散表現を考慮することで、表層の異なる単語やフレーズ等の意味表現、文書情報を理解した類似度算出が可能となるため、類似度算出の精度を向上させることができる。   In addition, when calculating the degree of similarity between the question sentence and the passage, by considering the sentence dependency information, the document structure, and the distributed representation of the words, you understand the semantic representation such as different words and phrases in the surface layer and the document information. Since the similarity calculation can be performed, the accuracy of the similarity calculation can be improved.

なお、本発明は、上述した実施の形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。   The present invention is not limited to the above-described embodiment, and various modifications and applications can be made without departing from the scope of the present invention.

また本発明は、周知のコンピュータに媒体もしくは通信回線を介して、図2の構成図に示された機能を実現するプログラムをインストールすることによっても実現可能である。   The present invention can also be realized by installing a program for realizing the functions shown in the block diagram of FIG. 2 in a known computer via a medium or communication line.

10 入力部
20 演算部
30 質問文ベクトル算出部
32 パッセージ検索部
34 類似度算出部
36 終了条件判定部
38 検索結果出力部
100 パッセージ型質問応答装置
10 input unit 20 operation unit 30 question sentence vector calculation unit 32 passage search unit 34 similarity calculation unit 36 end condition judgment unit 38 search result output unit 100 passage type question answering device

Claims (5)

一つ以上の階層的な構造を持つ文書と、前記文書に対する質問文とが与えられたときに、前記文書に含まれる、前記質問文に関連するテキストの範囲であるパッセージを、前記質問文の回答として出力するパッセージ型質問応答装置であって、
前記質問文の係り受け構造を考慮した質問文ベクトルを算出する質問文ベクトル算出部と、
前記文書に含まれる各文を、回答候補となる各パッセージの初期値とし、前記文書の構造及び文をノードとする木構造に基づいて、前記回答候補となるパッセージの各々について、前記パッセージを表す部分木とのノード間の距離が予め定められた距離以下となる文の各々を含むように前記パッセージを表す部分木を各々拡張していくことで、前記回答候補となるパッセージを検索するパッセージ検索部と、
前記検索された回答候補となる前記パッセージの各々を表すパッセージベクトルと、前記質問文ベクトルとの組み合わせの各々についての類似度を算出する類似度算出部と、
予め定められた終了条件を満たすまで前記パッセージ検索部、及び前記類似度算出部の処理を繰り返させる終了判定部と、
前記組み合わせの各々の類似度に基づいて、前記質問文の回答となる前記パッセージを出力する検索結果出力部と、
を含むパッセージ型質問応答装置。
When a document having one or more hierarchical structures and a question sentence for the document are given, a passage that is a range of text related to the question sentence and included in the document is A passage type question answering device that outputs as a response,
A question sentence vector calculation unit that calculates a question sentence vector considering the dependency structure of the question sentence;
Each passage included in the document is set as an initial value of each passage serving as an answer candidate, and the passage is represented for each passage serving as the answer candidate based on the structure of the document and a tree structure having the sentence as a node. The passage search which searches the passage which becomes the answer candidate by expanding the partial tree showing the passage so that each of the sentences whose distance between the partial tree and the node becomes equal to or less than a predetermined distance is expanded. Department,
A similarity calculation unit that calculates a similarity for each of a combination of a passage vector representing each of the passages which are the retrieved answer candidates and the question sentence vector;
An end determination unit that repeats the processing of the passage search unit and the similarity calculation unit until a predetermined end condition is satisfied;
A search result output unit that outputs the passage serving as the answer to the question sentence based on the degree of similarity of each of the combinations;
A passage type question answering device including:
前記類似度算出部は、前記パッセージを拡張していく過程において、前記算出された、拡張された後の前記パッセージを表すパッセージベクトルと、前記質問文ベクトルとの組合せに関する類似度が、拡張される前の前記パッセージを表すパッセージベクトルと、前記質問文ベクトルとの組合せに関する類似度以下である場合には、前記拡張された後の前記パッセージを拡張の対象から削除する請求項1に記載のパッセージ型質問応答装置。   In the process of expanding the passage, the similarity calculation unit expands the similarity of a combination of the calculated passage vector representing the passage after expansion and the question sentence vector. The passage type according to claim 1, wherein the passage after the expansion is deleted from the target of expansion if the degree of similarity with the combination of the passage vector representing the previous passage and the question sentence vector is equal to or less. Question Answerer. 一つ以上の階層的な構造を持つ文書と、前記文書に対する質問文とが与えられたときに、前記文書に含まれる、前記質問文に関連するテキストの範囲であるパッセージを、前記質問文の回答として出力するパッセージ型質問応答装置におけるパッセージ型質問応答方法であって、
質問文ベクトル算出部が、前記質問文の係り受け構造を考慮した質問文ベクトルを算出するステップと、
パッセージ検索部が、前記文書に含まれる各文を、各パッセージとするパッセージ集合の初期値とし、前記文書の構造及び文をノードとする木構造に基づいて、前記パッセージ集合におけるパッセージの各々について、前記パッセージを表す部分木とのノード間の距離が予め定められた距離以下となる文の各々を含むように前記パッセージを表す部分木を各々拡張していくことで、回答候補となる前記パッセージを検索するステップと、
類似度算出部が、前記検索された回答候補となる前記パッセージの各々を表すパッセージベクトルと、前記質問文ベクトルとの組み合わせの各々についての類似度を算出するステップと、
終了判定部が、予め定められた終了条件を満たすまで前記パッセージ検索部、及び前記類似度算出部の処理を繰り返させるステップと、
検索結果出力部が、前記組み合わせの各々の類似度に基づいて、前記質問文の回答となる前記パッセージを出力するステップと、
を含むパッセージ型質問応答方法。
When a document having one or more hierarchical structures and a question sentence for the document are given, a passage that is a range of text related to the question sentence and included in the document is A passage type question answering method in a passage type question answering device which is output as an answer, comprising:
The question sentence vector calculation unit calculates a question sentence vector in consideration of a dependency structure of the question sentence;
The passage retrieval unit sets each sentence included in the document as an initial value of the passage set as each passage, and based on the structure of the document and the tree structure having the sentences as nodes, for each passage in the passage set The passage serving as an answer candidate is expanded by respectively expanding the subtree representing the passage so that the distance between the node and the subtree representing the passage is less than or equal to a predetermined distance. Step of searching
Calculating a similarity for each of a combination of a passage vector representing each of the passages serving as the retrieved answer candidate, and the question sentence vector;
A step of causing the end determination unit to repeat the processing of the passage search unit and the similarity calculation unit until a predetermined end condition is satisfied;
Outputting the passage serving as the answer to the question sentence based on the degree of similarity of each of the combinations;
Passage type question answering method including.
前記類似度算出部が類似度を算出するステップにおいて、前記パッセージを拡張していく過程において、前記類似度算出部で算出された、拡張された後の前記パッセージを表すパッセージベクトルと、前記質問文ベクトルとの組合せに関する類似度が、拡張される前の前記パッセージを表すパッセージベクトルと、前記質問文ベクトルとの組合せに関する類似度以下である場合には、前記拡張された後の前記パッセージを拡張の対象から削除する請求項3に記載のパッセージ型質問応答方法。   In the step of the similarity calculation unit calculating the similarity, in the process of expanding the passage, a passage vector representing the passage after the expansion calculated by the similarity calculation unit, and the question sentence If the similarity for the combination with the vector is less than or equal to the similarity for the combination of the passage vector representing the passage before being expanded and the question sentence vector, then the passage after the expansion is expanded The passage type question answering method according to claim 3, which is deleted from the object. コンピュータを、請求項1又は請求項2に記載のパッセージ型質問応答装置の各部として機能させるためのプログラム。
The program for functioning a computer as each part of the passage type question answering apparatus of Claim 1 or Claim 2.
JP2017018662A 2017-02-03 2017-02-03 Passage type question answering device, method and program Active JP6543283B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017018662A JP6543283B2 (en) 2017-02-03 2017-02-03 Passage type question answering device, method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017018662A JP6543283B2 (en) 2017-02-03 2017-02-03 Passage type question answering device, method and program

Publications (2)

Publication Number Publication Date
JP2018124914A JP2018124914A (en) 2018-08-09
JP6543283B2 true JP6543283B2 (en) 2019-07-10

Family

ID=63111435

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017018662A Active JP6543283B2 (en) 2017-02-03 2017-02-03 Passage type question answering device, method and program

Country Status (1)

Country Link
JP (1) JP6543283B2 (en)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7081455B2 (en) * 2018-11-15 2022-06-07 日本電信電話株式会社 Learning equipment, learning methods, and learning programs
US11409754B2 (en) 2019-06-11 2022-08-09 International Business Machines Corporation NLP-based context-aware log mining for troubleshooting
CN111858879B (en) * 2020-06-18 2024-04-05 达观数据有限公司 Question and answer method and system based on machine reading understanding, storage medium and computer equipment
CN111782759B (en) * 2020-06-29 2024-04-19 数网金融有限公司 Question-answering processing method and device and computer readable storage medium
CN113761107B (en) * 2021-09-18 2024-06-07 杭州网易智企科技有限公司 Information processing method, medium, device and computing equipment based on question-answering system
WO2023079703A1 (en) * 2021-11-05 2023-05-11 楽天グループ株式会社 Processing execution system, processing execution method, and program

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4654776B2 (en) * 2005-06-03 2011-03-23 富士ゼロックス株式会社 Question answering system, data retrieval method, and computer program
JP5103051B2 (en) * 2007-04-17 2012-12-19 株式会社日立製作所 Information processing system and information processing method
JP5259462B2 (en) * 2009-03-12 2013-08-07 株式会社東芝 Apparatus, method and program for supporting search
JP5869948B2 (en) * 2012-04-19 2016-02-24 株式会社日立製作所 Passage dividing method, apparatus, and program

Also Published As

Publication number Publication date
JP2018124914A (en) 2018-08-09

Similar Documents

Publication Publication Date Title
JP6543283B2 (en) Passage type question answering device, method and program
Zwicklbauer et al. Doser-a knowledge-base-agnostic framework for entity disambiguation using semantic embeddings
KR101991320B1 (en) Method for extending ontology using resources represented by the ontology
JP5710581B2 (en) Question answering apparatus, method, and program
CN110929038A (en) Entity linking method, device, equipment and storage medium based on knowledge graph
CN113268569B (en) Semantic-based related word searching method and device, electronic equipment and storage medium
CN108875065B (en) Indonesia news webpage recommendation method based on content
JP2011118689A (en) Retrieval method and system
KR101095866B1 (en) Triple indexing and searching scheme for efficient information retrieval
JP2007219947A (en) Causal relation knowledge extraction device and program
CN114462384B (en) Metadata automatic generation device for digital object modeling
Charton et al. Automatic semantic web annotation of named entities
CN117390169B (en) Form data question-answering method, device, equipment and storage medium
CN112231513A (en) Learning video recommendation method, device and system
KR102206742B1 (en) Method and apparatus for representing lexical knowledge graph from natural language text
JP2009277099A (en) Similar document retrieval device, method and program, and computer readable recording medium
JP2007164635A (en) Method, device and program for acquiring synonymous vocabulary
KR100433584B1 (en) Method for product detailed information extraction of internet shopping mall with ontology and wrapper data
JP4148247B2 (en) Vocabulary acquisition method and apparatus, program, and computer-readable recording medium
Chahal et al. An ontology based approach for finding semantic similarity between web documents
KR100659370B1 (en) Method for constructing a document database and method for searching information by matching thesaurus
CN112989163A (en) Vertical search method and system
CN112100500A (en) Example learning-driven content-associated website discovery method
JP6634001B2 (en) Text summarization apparatus, method, and program
Lam et al. Web information extraction

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180625

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190529

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190611

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190614

R150 Certificate of patent or registration of utility model

Ref document number: 6543283

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150