JP2017054434A - Contradiction creation device, method, and program - Google Patents

Contradiction creation device, method, and program Download PDF

Info

Publication number
JP2017054434A
JP2017054434A JP2015179839A JP2015179839A JP2017054434A JP 2017054434 A JP2017054434 A JP 2017054434A JP 2015179839 A JP2015179839 A JP 2015179839A JP 2015179839 A JP2015179839 A JP 2015179839A JP 2017054434 A JP2017054434 A JP 2017054434A
Authority
JP
Japan
Prior art keywords
pair
contradiction
noun
relationship
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015179839A
Other languages
Japanese (ja)
Other versions
JP6597958B2 (en
Inventor
竜一郎 東中
Ryuichiro Higashinaka
竜一郎 東中
義博 松尾
Yoshihiro Matsuo
義博 松尾
禎夫 黒橋
Sadao Kurohashi
禎夫 黒橋
大輔 河原
Daisuke Kawahara
大輔 河原
悠 高畠
Yu Takabatake
悠 高畠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyoto University
Nippon Telegraph and Telephone Corp
Original Assignee
Kyoto University
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyoto University, Nippon Telegraph and Telephone Corp filed Critical Kyoto University
Priority to JP2015179839A priority Critical patent/JP6597958B2/en
Publication of JP2017054434A publication Critical patent/JP2017054434A/en
Application granted granted Critical
Publication of JP6597958B2 publication Critical patent/JP6597958B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

PROBLEM TO BE SOLVED: To create a new contradiction situation pair.SOLUTION: A relation extraction unit 20 extracts a relation of a noun pair for contradiction by checking a contradiction situation pair database 18 and a noun relation database 16 and creates a relation list in which the relation of the extracted noun pair is stored. Regarding a contradiction situation pair obtained from the contradiction situation pair database 18, if the relation of a noun pair included in the contradiction situation pair is included in the relation list 22, a noun pair replacement unit 28 acquires a noun pair having the same relation with the relation of the noun pair from the noun relation database 16 and creates a contradiction situation pair by replacing the noun pair of the contradiction situation pair with the acquired noun pair. A single noun replacement unit 30 extracts a coordinate term of a shared noun that the acquired contradiction situation pair has from the noun relation database 16 and creates the contradiction situation pair by replacing the shared noun of the contradiction situation pair with the acquired coordinate term.SELECTED DRAWING: Figure 1

Description

本発明は、矛盾作成装置、方法、及びプログラムに係り、特に、新たな矛盾事態ペアを作成するための矛盾作成装置、方法、及びプログラムに関する。   The present invention relates to a contradiction creation device, method, and program, and more particularly, to a contradiction creation device, method, and program for creating a new contradiction situation pair.

自然言語処理における言語生成の分野では一貫した内容を持つ文章を生成することが重要である。しかし、コンピュータの生成する文章が一貫した内容を持つかを判定することは常識的な知識が必要となり簡単ではない。   In the field of language generation in natural language processing, it is important to generate sentences with consistent contents. However, it is not easy to determine whether a computer-generated sentence has consistent contents because it requires common sense knowledge.

たとえば、一貫性を欠く場合として、生成された文章に矛盾が含まれる場合がある。たとえば、「パリに行ったことがないが、エッフェル塔に登った」という文は矛盾を含んでいる。「パリに行ったことがない」ことと「エッフェル塔に登ったこと」は矛盾するからである。   For example, inconsistency may be included in the generated sentence as a case where consistency is lacking. For example, the sentence “I have never been to Paris but climbed the Eiffel Tower” contains a contradiction. This is because “I have never been to Paris” and “I climbed the Eiffel Tower” are contradictory.

このような矛盾を含む文章の生成を避けるためには、矛盾の知識を用いてチェックする必要がある。   In order to avoid the generation of a sentence containing such a contradiction, it is necessary to check using knowledge of the contradiction.

たとえば、「パリに行ったことがない」ことと「エッフェル塔に登ったこと」が矛盾しているという知識をコンピュータが持っていれば、先の例のような文は生成されることはない。   For example, if the computer has the knowledge that "I have never been to Paris" and "I climbed the Eiffel Tower" are contradictory, a sentence like the previous example will not be generated. .

このような矛盾知識を取得する方法論として,コーパスから自動獲得する方法(非特許文献1参照)やクラウドソーシング(インターネット上のユーザにデータ作成を依頼する手法)を用いる方法などがある(非特許文献2参照)。   As a methodology for acquiring such contradiction knowledge, there are a method of automatically acquiring from a corpus (see Non-Patent Document 1) and a method of using crowdsourcing (a method for requesting data creation from a user on the Internet) (Non-Patent Document 1). 2).

Chikara Hashimoto, Kentaro Torisawa, Stijn De Saeger, Jong-Hoon Oh, and Jun'ichi Kazama. Excitatory or inhibitory: A new semantic orientation extracts contradiction and causality from the web. In Proceedings of EMNLP2012, pp. 619-630, 2012.Chikara Hashimoto, Kentaro Torisawa, Stijn De Saeger, Jong-Hoon Oh, and Jun'ichi Kazama.Excitatory or inhibitory: A new semantic orientation extracts contradiction and causality from the web.In Proceedings of EMNLP2012, pp. 619-630, 2012. 高畠悠, 森田一, 河原大輔, 黒橋禎夫, 東中竜一郎, 松尾義博. クラウドソーシングを活用した事態間矛盾の分析と分類, 言語処理学会第21 回年次大会, pp.305-308,2015.Takamine, Hajime Morita, Daisuke Kawahara, Ikuo Kurohashi, Ryuichiro Higashinaka, Yoshihiro Matsuo. Analysis and classification of conflicts between situations using crowdsourcing, 21st Annual Meeting of the Language Processing Society, pp.305-308,2015 .

コーパスから自動的に矛盾を抽出するとしても、クラウドソーシングを用いるとしても、獲得できる矛盾知識の量には限界がある。人間が備える常識的知識(矛盾知識を含む)は膨大と考えられ、矛盾知識の量を増やすことは重要な課題である。   Even if the contradiction is automatically extracted from the corpus or the crowdsourcing is used, the amount of contradiction knowledge that can be acquired is limited. Common sense knowledge (including contradiction knowledge) provided by humans is considered enormous, and increasing the amount of contradiction knowledge is an important issue.

本発明は上記事情を鑑みてなされたものであり、新しい矛盾事態ペアを作成できる矛盾作成装置、方法、及びプログラムを提供することを目的とする。   The present invention has been made in view of the above circumstances, and an object thereof is to provide a contradiction creation apparatus, method, and program capable of creating a new contradiction pair.

上記目的を達成するために、第1の発明に係る矛盾作成装置は、矛盾する事態を表す文のペアである矛盾事態ペアを格納した矛盾事態ペアデータベースと、名詞ペア及び前記名詞ペアの関係を格納した名詞関係データベースとを照合することで、矛盾に関する名詞ペアの関係を抽出し、抽出した名詞ペアの関係を格納した関係リストを作成する関係抽出部と、前記矛盾事態ペアデータベースから得られる前記矛盾事態ペアについて、前記矛盾事態ペアに含まれる名詞ペアの関係が、前記関係リストに含まれる場合、前記名詞ペアの関係と同じ関係を持つ名詞ペアを前記名詞関係データベースから取得し、前記取得した名詞ペアによって前記矛盾事態ペアの名詞ペアを置き換えることで矛盾事態ペアを作成する名詞ペア置換部と、を含んで構成されている。   In order to achieve the above object, the contradiction creation device according to the first invention includes a contradiction pair database storing a contradiction pair, which is a pair of sentences representing contradictory situations, and a relationship between the noun pair and the noun pair. By comparing the stored noun relationship database, the relationship between the noun pairs related to the contradiction is extracted, the relationship extraction unit that creates the relationship list storing the relationship of the extracted noun pairs, and the contradiction situation pair database obtained above For the contradiction pair, when the relationship of the noun pair included in the contradiction pair is included in the relationship list, the noun pair having the same relationship as the relationship of the noun pair is acquired from the noun relationship database, and the acquired A noun pair replacement unit that creates a contradiction pair by replacing the noun pair of the contradiction pair by a noun pair. It has been.

第2の発明に係る矛盾作成方法は、関係抽出部及び名詞ペア置換部を含む矛盾作成装置における矛盾作成方法であって、前記関係抽出部が、矛盾する事態を表す文のペアである矛盾事態ペアを格納した矛盾事態ペアデータベースと、名詞ペア及び前記名詞ペアの関係を格納した名詞関係データベースとを照合することで、矛盾に関する名詞ペアの関係を抽出し、抽出した名詞ペアの関係を格納した関係リストを作成し、前記名詞ペア置換部が、前記矛盾事態ペアデータベースから得られる前記矛盾事態ペアについて、前記矛盾事態ペアに含まれる名詞ペアの関係が、前記関係リストに含まれる場合、前記名詞ペアの関係と同じ関係を持つ名詞ペアを前記名詞関係データベースから取得し、前記取得した名詞ペアによって前記矛盾事態ペアの名詞ペアを置き換えることで矛盾事態ペアを作成する。   A contradiction creation method according to a second invention is a contradiction creation method in a contradiction creation device including a relationship extraction unit and a noun pair replacement unit, wherein the relationship extraction unit is a pair of sentences representing a conflicting situation. By comparing the contradiction pair database storing pairs with the noun pair and the noun relationship database storing the relationship between the noun pairs, the relationship between the noun pairs related to the contradiction is extracted, and the relationship between the extracted noun pairs is stored. Creating a relationship list, and when the noun pair replacement unit includes the contradiction pair obtained from the contradiction pair database, the noun pair included in the contradiction pair is included in the relationship list, the noun A noun pair having the same relationship as the pair relationship is acquired from the noun relationship database, and the name of the contradiction pair is acquired by the acquired noun pair. To create a conflict situation pair by replacing the pair.

第1の発明及び第2の発明によれば、矛盾に関する名詞ペアの関係を抽出して関係リストを作成し、データベースから得られた矛盾事態ペアに含まれる名詞ペアの関係が、関係リストに含まれる場合、名詞ペアの関係と同じ関係を持つ名詞ペアを名詞関係データベースから取得し、取得した名詞ペアによって矛盾事態ペアの名詞ペアを置き換えることで、新しい矛盾事態ペアを作成できる。   According to 1st invention and 2nd invention, the relationship of the noun pair regarding a contradiction is extracted and the relationship list is created, and the relationship of the noun pair included in the contradiction pair obtained from the database is included in the relationship list. In this case, a new contradiction pair can be created by acquiring a noun pair having the same relationship as that of the noun pair from the noun relation database and replacing the noun pair of the contradiction pair with the acquired noun pair.

第3の発明に係る矛盾作成装置は、矛盾する事態を表す文のペアである矛盾事態ペアを格納した矛盾事態ペアデータベースから、前件と後件とで共通する共有名詞を持つ矛盾事態ペアを取得する矛盾事態ペア取得部と、名詞ペア及び前記名詞ペアの関係を格納した名詞関係データベースから、前記矛盾事態ペア取得部によって取得した矛盾事態ペアが持つ共有名詞の同位語を抽出し、前記抽出した同位語により前記矛盾事態ペアの共有名詞を置き換えることで、矛盾事態ペアを作成する単一名詞置換部と、を含んで構成されている。   The contradiction creating apparatus according to the third invention is configured to obtain a contradiction pair having a common noun common to the antecedent and the consequent from the contradiction pair database storing the contradiction pair that is a pair of sentences representing the contradictory situation. Extracting a noun pair and a noun pair and a noun relation database storing relations of the noun pair, and extracting a common noun synonym of the contradiction pair acquired by the contradiction pair acquiring unit And a single noun replacement unit that creates a contradiction pair by replacing the common noun of the contradiction pair with the same isotope.

第4の発明に係る矛盾作成方法は、矛盾事態ペア取得部及び単一名詞置換部を含む矛盾作成装置における矛盾作成方法であって、前記矛盾事態ペア取得部が、矛盾する事態を表す文のペアである矛盾事態ペアを格納した矛盾事態ペアデータベースから、前件と後件とで共通する共有名詞を持つ矛盾事態ペアを取得し、前記単一名詞置換部が、名詞ペア及び前記名詞ペアの関係を格納した名詞関係データベースから、前記矛盾事態ペア取得部によって取得した矛盾事態ペアが持つ共有名詞の同位語を抽出し、前記抽出した同位語により前記矛盾事態ペアの共有名詞を置き換えることで、矛盾事態ペアを作成する。   A contradiction creation method according to a fourth invention is a contradiction creation method in a contradiction creation device including a contradiction pair acquisition unit and a single noun substitution unit, wherein the contradiction pair acquisition unit A contradiction pair having a common noun common to the antecedent and the consequent is obtained from the contradiction pair database storing the contradiction pair that is a pair, and the single noun replacement unit includes the noun pair and the noun pair. From the noun relation database storing the relationship, extracting the common noun isotopes of the contradiction pair acquired by the contradiction pair acquisition unit, replacing the common noun of the contradiction pair with the extracted isotope, Create a contradiction pair.

第3の発明及び第4の発明によれば、矛盾事態ペアデータベースから、共有名詞を持つ矛盾事態ペアを取得し、名詞関係データベースから、取得した矛盾事態ペアが持つ共有名詞の同位語を抽出し、取得した同位語により矛盾事態ペアの共有名詞を置き換えることで、新しい矛盾事態ペアを作成できる。   According to the third invention and the fourth invention, a contradiction pair having a common noun is acquired from the contradiction pair database, and a common noun synonym of the acquired contradiction pair is extracted from the noun relation database. A new contradiction pair can be created by replacing the common noun of the contradiction pair with the acquired isotope.

また、第5の発明に係るプログラムは、コンピュータを、上記の矛盾作成装置を構成する各部として機能させるためのプログラムである。   A program according to a fifth aspect of the invention is a program for causing a computer to function as each part constituting the contradiction creation device.

以上説明したように、本発明の矛盾作成装置、方法、及びプログラムによれば、新しい矛盾事態ペアを作成できる、という効果が得られる。   As described above, according to the contradiction creation apparatus, method, and program of the present invention, an effect that a new contradiction situation pair can be created is obtained.

本発明の実施の形態に係る矛盾作成装置の構成を示すブロック図である。It is a block diagram which shows the structure of the contradiction creation apparatus which concerns on embodiment of this invention. 本発明の実施の形態における矛盾作成処理ルーチンの内容を示すフローチャートである。It is a flowchart which shows the content of the contradiction creation process routine in embodiment of this invention. 実験結果を示す図である。It is a figure which shows an experimental result.

以下、図面を参照して本発明の実施の形態を詳細に説明する。本発明の実施の形態では、矛盾事態ペアデータベースに含まれる矛盾事態ペアを拡充する場合を例に説明する。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. In the embodiment of the present invention, a case where the contradiction pair included in the contradiction pair database is expanded will be described as an example.

<本実施の形態の概要>
矛盾事態ペアデータベースが存在するときに、データベース中の矛盾事態ペアを、知識ベースから得られる名詞関係データベースを用いて拡張することによって、新しい矛盾事態ペアを獲得する。
<Outline of the present embodiment>
When a contradiction pair database exists, a new contradiction pair is obtained by extending the contradiction pair in the database using a noun relation database obtained from the knowledge base.

ここで、矛盾事態ペアデータベースは矛盾事態ペアのリストである。矛盾事態ペアとは矛盾する二つの事態を表す文であり、それぞれの事態を表す文は述語項構造で表現されるとする。述語項構造は、一つの述語と一つ以上の項(名詞句)からなるとする。矛盾事態ペアの例を次に示す。   Here, the conflict pair database is a list of conflict pairs. The contradictory situation pair is a sentence representing two contradictory situations, and the sentence representing each situation is represented by a predicate term structure. The predicate term structure is composed of one predicate and one or more terms (noun phrases). An example of a contradiction pair is shown below.

< フランスへ行かない, エッフェル塔に行く>
< 旅行の予定を立てない, 海外ツアーに申し込む>
<Go to France, go to the Eiffel Tower>
<Do not schedule trips, apply for overseas tours>

名詞関係データベースとは、2つの名詞と、当該2つの名詞間の関係を示したもので、既存の知識ベースから構築される。   The noun relation database indicates two nouns and the relation between the two nouns, and is constructed from an existing knowledge base.

既存の知識ベースとは、たとえば、Freebase(登録商標)(https://www.freebase.com/)である。Freebase(登録商標)では、二つの物事とその関係を三つ組みで表したデータが大量に格納されている。そして、Freebase(登録商標)には名詞とその関係として以下のようなものが含まれており、それらを取得して名詞関係データベースとする。   The existing knowledge base is, for example, Freebase (registered trademark) (https://www.freebase.com/). Freebase (registered trademark) stores a large amount of data that expresses two things and their relationships in triplicate. Freebase (registered trademark) includes the following as nouns and their relations, and obtains them as a noun relation database.

(エッフェル塔, contained-by, フランス)
(箱根, contained-by, 神奈川県)
(Eiffel Tower, contained-by, France)
(Hakone, contained-by, Kanagawa)

ここで、contained-by は「含まれる」という関係であり、エッフェル塔はフランスに含まれるという意味である。また二つ目の例では、箱根が神奈川県に含まれるという意味である。このような2つの名詞とその関係を表す名詞関係データベースを用いて矛盾事態ペアを新しく作成することができる。たとえば、 < フランスへ行かない, エッフェル塔に行く> という矛盾事態ペアには、それぞれ項としてフランスとエッフェル塔が含まれている。そして、これらは名詞関係データベースによるとcontained-by関係にある。よって、同じくcontained-by 関係にある箱根と神奈川県によって置き換えられると仮定し、< 神奈川県へ行かない, 箱根に行く> という新しい矛盾事態ペアを作成することができる。なお、ここでは、contained-by 関係のみに着目した例を示したが、名詞関係データベースに含まれる他の関係を用いてもよい。   Here, contained-by means “included”, meaning that the Eiffel Tower is included in France. In the second example, Hakone is included in Kanagawa Prefecture. A contradiction pair can be newly created using such a noun relation database representing the two nouns and their relations. For example, the contradictory pair <Go to France, Go to the Eiffel Tower> includes the terms France and the Eiffel Tower respectively. And these are contained-by according to the noun relation database. Therefore, assuming that it is replaced by Hakone and Kanagawa Prefecture, which are also in a contained-by relationship, a new contradiction pair can be created: <Do not go to Kanagawa Prefecture, go to Hakone>. In addition, although the example which paid attention only to the contained-by relationship was shown here, you may use the other relationship contained in a noun relationship database.

新しく作られた矛盾事態ペアに含まれる内容は、自動的に作成したものであるため、文法や意味的な誤りなどのノイズが含まれている可能性がある。そこで、大規模テキストコーパスに、矛盾事態ペアに含まれる内容が閾値以上の回数存在するかどうかによって、内容としての適切性をチェックする。   Since the content included in the newly created contradiction pair is automatically created, it may contain noise such as grammar and semantic errors. Therefore, the appropriateness of the content is checked depending on whether or not the content included in the contradictory state pair is present more than a threshold value in the large text corpus.

<システム構成>
本発明の実施の形態に係る矛盾作成装置10は、CPU(Central Processing Unit)と、RAM(Random Access Memory)と、後述する矛盾作成処理ルーチンを実行するための矛盾作成プログラムを記憶したROM(Read Only Memory)とを備えたコンピュータで構成されている。CPUが矛盾作成プログラムを、内部記憶装置であるROMから読み込んで実行することにより、コンピュータが矛盾作成装置10として機能する。
<System configuration>
A contradiction creation device 10 according to an embodiment of the present invention includes a CPU (Central Processing Unit), a RAM (Random Access Memory), and a ROM (Read Read) that stores a contradiction creation program for executing a contradiction creation processing routine described later. Only memory). The CPU functions as the contradiction creation device 10 when the CPU reads and executes the contradiction creation program from the ROM which is an internal storage device.

図1に示すように、矛盾作成装置10は、知識ベース群12、名詞関係取得部14、名詞関係データベース16、矛盾事態ペアデータベース18、関係抽出部20、矛盾事態ペア取得部24、矛盾事態ペア作成部26、チェック部32、大規模テキストコーパス34、及びデータベース追加部36を備えている。   As shown in FIG. 1, the contradiction creation device 10 includes a knowledge base group 12, a noun relationship acquisition unit 14, a noun relationship database 16, a contradiction situation pair database 18, a relationship extraction unit 20, a contradiction situation pair acquisition unit 24, a contradiction situation pair. A creation unit 26, a check unit 32, a large-scale text corpus 34, and a database addition unit 36 are provided.

知識ベース群12は、第1知識ベース12A、第2知識ベース12B、及び第3知識ベース12Cを備えている。   The knowledge base group 12 includes a first knowledge base 12A, a second knowledge base 12B, and a third knowledge base 12C.

本実施の形態では、第1知識ベース12Aとして、Freebase(登録商標)を用い、第2知識ベース12Bとして、Wikipedia(登録商標)を用い、第3知識ベース12Cとして、国語辞典を用いる。なお、これらの知識ベース以外の知識ベースも名詞とそれらの関係が得られるものであれば何でもよい。たとえば、NTT(登録商標)の日本語語彙大系を用いてもよい。   In the present embodiment, Freebase (registered trademark) is used as the first knowledge base 12A, Wikipedia (registered trademark) is used as the second knowledge base 12B, and a Japanese dictionary is used as the third knowledge base 12C. Any knowledge base other than these knowledge bases can be used as long as it can obtain nouns and their relationships. For example, NTT (registered trademark) Japanese vocabulary system may be used.

名詞関係取得部14は、第1知識ベース12A〜第3知識ベース12Cから、名詞ペアと当該名詞ペアの関係とを取得し、名詞関係データベース16に格納する。   The noun relationship acquisition unit 14 acquires the noun pair and the relationship between the noun pair from the first knowledge base 12 </ b> A to the third knowledge base 12 </ b> C and stores them in the noun relationship database 16.

Freebase(登録商標)には、基本的に2つの名詞とその関係が三つ組みとして格納されているため、これらの三つ組みをすべて抽出すればよい。Wikipedia(登録商標)、国語辞典については、辞書の見出しとその定義文をもとに、上位下位関係にある名詞を取得することが可能である。たとえば、下記の非特許文献3や非特許文献4の手法を使えばよい。例えば、国語辞典に、見出し「三輪車」の定義文として「乗り物の一つ」とあれば、三輪車の上位語が乗り物であることが分かり、「三輪車」と「乗り物」が上位下位関係であるという名詞関係が取得できる。   Freebase (registered trademark) basically stores two nouns and their relationships as triples, so all these triples can be extracted. For Wikipedia (registered trademark) and Japanese language dictionaries, it is possible to obtain nouns that are in a higher-level relationship based on dictionary headings and their definition sentences. For example, the following methods of Non-Patent Document 3 and Non-Patent Document 4 may be used. For example, in the Japanese dictionary, if the headline “Tricycle” is defined as “One of the vehicles”, it is understood that the broader term of the tricycle is a vehicle, and “Tricycle” and “Vehicle” are in a lower-level relationship. Noun relations can be acquired.

[非特許文献3]:隅田飛鳥, 吉永直樹, 鳥澤健太郎, Wikipedia の記事構造からの上位下位関係抽出, 自然言語処理, vol.16(3), pp.3-24, 2008. [Non-Patent Document 3]: Asuka Sumida, Naoki Yoshinaga, Kentaro Torizawa, Extracting upper and lower relations from Wikipedia article structure, natural language processing, vol.16 (3), pp.3-24, 2008.

[非特許文献4]:大福泰樹, 河原大輔, 黒橋禎夫,大規模コーパスと国語辞典の統合的利用によるシソーラスの自動構築,言語処理学会第10 回年次大会, 2004. [Non-patent document 4]: Yasuki Daifuku, Daisuke Kawahara, Ikuo Kurohashi, Automatic construction of a thesaurus by integrated use of large-scale corpus and Japanese dictionary, 10th Annual Conference of the Language Processing Society, 2004.

Freebase(登録商標)やWikipedia(登録商標)、国語辞典から抽出された名詞関係データベース16に含まれるデータの例は以下の通りである。   Examples of data included in the noun relation database 16 extracted from Freebase (registered trademark), Wikipedia (registered trademark), and Japanese dictionary are as follows.

(エッフェル塔, contained-by, フランス)
(箱根, contained-by, 神奈川県)
(ゴルフ, sports-equipment, ゴルフクラブ)
(野球, sports-equipment, バット)
(海外ツアー, is-a, 旅行)
(国内ツアー, is-a, 旅行)
(TOEIC テスト, is-a, テスト)
(テニス, is-a, 球技)
(ゴルフ, is-a, 球技)
(Eiffel Tower, contained-by, France)
(Hakone, contained-by, Kanagawa)
(Golf, sports-equipment, golf club)
(Baseball, sports-equipment, bat)
(Overseas tour, is-a, travel)
(Domestic tour, is-a, travel)
(TOEIC test, is-a, test)
(Tennis, is-a, ball game)
(Golf, is-a, ball game)

最初の4つはFreebase(登録商標)によるものである。contained-by は先に示した通り、「〜に含まれる」という関係を表し、sports-equipment はスポーツとそのスポーツにて使われる道具の関係を表す。たとえば、「ゴルフ」と「ゴルフクラブ」はsports-equipment の関係にある。以降のis-a は上位下位関係(左側が下位語,右側が上位語)を表す。たとえば、海外ツアーは旅行の下位語である。   The first four are from Freebase (R). As mentioned above, contained-by represents the relationship “contained in” and sports-equipment represents the relationship between the sport and the tool used in that sport. For example, “golf” and “golf club” have a sports-equipment relationship. The following is-a represents the broader relation (the left side is the narrower term and the right side is the broader term) For example, an overseas tour is a subordinate term for travel.

また、同じ上位語に対してis-a 関係をもつ下位語集合(下位語間の関係を「同位語」と呼ぶ) についても、名詞関係データベース16に登録しておく。たとえば、「旅行」に対して「海外ツアー」「国内ツアー」など、「球技」に対して「テニス」「ゴルフ」などの同位語が得られる。同位語については、以下の様に名詞関係データベース16に格納されている。   In addition, a lower word set having an is-a relationship with the same broader word (a relationship between the lower words is referred to as a “same word”) is also registered in the noun relation database 16. For example, “overseas tour”, “domestic tour”, etc. for “travel”, and “tennis”, “golf”, etc. for “ball games” are obtained. The synonyms are stored in the noun relation database 16 as follows.

(海外ツアー, 同位語, 国内ツアー)
(テニス, 同位語, ゴルフ)
(Overseas tour, same language, domestic tour)
(Tennis, isotope, golf)

矛盾事態ペアデータベース18は、矛盾する事態を表す文のペアである矛盾事態ペアを複数記憶している。   The contradiction situation pair database 18 stores a plurality of contradiction situation pairs, which are pairs of sentences representing contradictory situations.

矛盾事態ペアデータベース18を、人手で作成してもよいし,非特許文献1や非特許文献2の手法で構築してもよい。   The contradiction situation pair database 18 may be created manually or may be constructed by the method of Non-Patent Document 1 or Non-Patent Document 2.

関係抽出部20は、矛盾事態ペアデータベース18と名詞関係データベース16を照合し、矛盾事態ペアデータベース18において閾値以上の回数出現する、矛盾に関する名詞ペアの関係を抽出し、抽出した名詞ペアの関係を格納した関係リスト22を作成する。   The relationship extraction unit 20 collates the contradiction pair database 18 and the noun relationship database 16, extracts the relationship between the noun pairs related to the contradiction that appears in the contradiction pair database 18 a number of times greater than or equal to the threshold, and determines the relationship between the extracted noun pairs. The stored relation list 22 is created.

具体的には、まず、矛盾事態ペアデータベース18に記憶されている、それぞれの矛盾事態(述語項構造)ペア中の項部分から名詞ペアを抽出する。ここで、名詞ペアのそれぞれの名詞は、異なる述語項構造から抽出することとし、名詞は複合名詞(2つ以上の名詞の連続)も含める。   Specifically, first, a noun pair is extracted from the term part in each contradiction (predicate term structure) pair stored in the contradiction pair database 18. Here, each noun of a noun pair is extracted from a different predicate term structure, and the noun includes a compound noun (a sequence of two or more nouns).

次に、これらの名詞のペアが名詞関係データベース16に存在するかどうかをチェックし、存在するならば、どういう関係で存在するかを検索し、集計する。   Next, it is checked whether or not these noun pairs exist in the noun relation database 16, and if they exist, the relation in which they exist is searched and tabulated.

たとえば、前述の矛盾事態ペアデータベース18からは、(フランス, エッフェル塔)、(旅行, 海外ツアー)、(予定, 海外ツアー) という名詞ペアが抽出され、そのうち(フランス, エッフェル塔)、(旅行, 海外ツアー) の二つが名詞関係データベース16に存在することが分かる。そのため、contained-by、is-aの関係がそれぞれ1回ずつカウントアップされる。このように矛盾事態ペアデータベース18に含まれるすべての矛盾事態ペアにおける名詞ペアについて、名詞関係データベース16を照合し、どの関係が何回照合できたかを数え上げる。   For example, the above-mentioned contradiction pair database 18 extracts the noun pairs (France, Eiffel Tower), (Travel, Overseas Tour), (Schedule, Overseas Tour), of which (France, Eiffel Tower), (Travel, It can be seen that there are two types of overseas tours) in the noun relation database 16. Therefore, the relationship between contained-by and is-a is counted up once. As described above, the noun relation database 16 is collated with respect to the noun pairs in all the contradiction pair included in the contradiction pair database 18 to count which relations can be collated.

なお、照合においては、表記の揺らぎに対処するため、形態素解析器JUMAN の出力する代表表記を用いて行う。もちろん、揺らぎ情報を含むような辞書があればそれを用いる。   The matching is performed using the representative notation output from the morphological analyzer JUMAN in order to deal with fluctuations in the notation. Of course, if there is a dictionary including fluctuation information, it is used.

最後に、見つかった名詞ペアの関係の出現回数が、それぞれ所定の閾値(たとえば、10)を超えているかどうかを確認し、超えていれば、その名詞ペアの関係を矛盾作成に有効な関係として関係リスト22に追加する。ここでの処理は、どのような関係を持つ名詞が矛盾事態ペアに現われやすいかを調べ上げる処理と言える。   Finally, check whether the number of occurrences of the found noun pair relationship exceeds a specified threshold value (for example, 10), and if so, the noun pair relationship is considered an effective relationship for creating a contradiction. Add to the relationship list 22. The process here can be said to be a process for examining what relationship nouns are likely to appear in a contradiction pair.

矛盾事態ペア取得部24は、予め用意された矛盾事態ペアデータベース18から、前件と後件とで項部分に共通する共有名詞を持つ矛盾事態ペアを一つ以上取り出し、後述する単一名詞置換部30へ送る。   The contradiction event pair acquisition unit 24 extracts one or more contradiction event pairs having a common noun common to the term part in the antecedent and consequent from the prepared contradiction event pair database 18 and replaces a single noun replacement described later. Send to part 30.

また、矛盾事態ペア取得部24は、予め用意された矛盾事態ペアデータベース18から、共有名詞をもたない矛盾事態ペアを一つ以上取り出し、後述する名詞ペア置換部28へ送る。   In addition, the contradiction event pair acquisition unit 24 extracts one or more contradiction event pairs having no shared noun from the previously prepared contradiction event pair database 18 and sends them to the noun pair replacement unit 28 described later.

ここで取り出された矛盾事態ペアは、一つずつ、後段の名詞ペア置換部28及び単一名詞置換部30で処理される。   The contradictory situation pairs extracted here are processed one by one by the noun pair replacement unit 28 and the single noun replacement unit 30 in the subsequent stage.

以下は、矛盾事態ペアデータベース18に含まれる、共有名詞をもたない矛盾事態ペアの例である。   The following is an example of a contradiction pair that is included in the contradiction pair database 18 and does not have a common noun.

< フランスへ行かない, エッフェル塔に行く>
< 旅行の予定を立てない, 海外ツアーに申し込む>
<Go to France, go to the Eiffel Tower>
<Do not schedule trips, apply for overseas tours>

矛盾事態ペア作成部26は、名詞ペア置換部28及び単一名詞置換部30を備えている。   The contradiction situation pair creation unit 26 includes a noun pair replacement unit 28 and a single noun replacement unit 30.

名詞ペア置換部28は、矛盾事態ペアデータベース18から得られる、共有名詞をもたない矛盾事態ペアの各々について、当該矛盾事態ペアに含まれる名詞ペアの関係が、関係リスト22に含まれる場合、名詞ペアの関係と同じ関係を持つ名詞ペアを名詞関係データベース16から取得し、取得した名詞ペアによって当該矛盾事態ペアの名詞ペアを置き換えることで矛盾事態ペアを作成する。   When the relationship list 22 includes the relationship of the noun pairs included in the contradiction pair for each of the contradiction pairs having no shared noun obtained from the contradiction pair database 18, the noun pair replacement unit 28 includes: A noun pair having the same relationship as the noun pair relationship is acquired from the noun relationship database 16, and the contradiction pair is created by replacing the noun pair of the contradiction pair with the acquired noun pair.

たとえば,< フランスへ行かない, エッフェル塔に行く> が処理対象だとすると、まず、ここから名詞ペアを抽出する。名詞ペアは(フランス, エッフェル塔)である。そして、名詞関係データベース16を参照し、フランスとエッフェル塔の間の関係を探す。そうすると、contained-by の関係であることが分かる。この関係は関係抽出部20が得た関係リスト22に含まれているため、同じ関係をもつ別の名詞ペアを名詞関係データベース16から取得して、当該矛盾事態ペアの名詞ペアと置換し,新しい矛盾事態ペアを生成する。たとえば、この例からは次の新しい矛盾事態ペアとして以下が生成される。   For example, if <not go to France, go to the Eiffel Tower> is a processing target, first, a noun pair is extracted from here. The noun pair is (France, Eiffel Tower). Then, the noun relation database 16 is referred to look for the relation between France and the Eiffel Tower. You can see that it is a contained-by relationship. Since this relationship is included in the relationship list 22 obtained by the relationship extraction unit 20, another noun pair having the same relationship is acquired from the noun relationship database 16 and replaced with the noun pair of the contradiction pair. Create a contradiction pair. For example, from this example, the following new contradiction pair is generated:

< 神奈川県へ行かない, 箱根に行く> <Don't go to Kanagawa Prefecture, go to Hakone>

ここでは、神奈川県と箱根の関係がcontained-by であることから、フランスを神奈川で、エッフェル塔を箱根で置換している。このように置き換えることで新しい矛盾事態ペアを作成できる。   Here, the relationship between Kanagawa Prefecture and Hakone is contained-by, so we have replaced France with Kanagawa and the Eiffel Tower with Hakone. By replacing in this way, a new contradiction pair can be created.

新しく作成された矛盾事態ペアはチェック部32に送られる。   The newly created contradiction pair is sent to the check unit 32.

単一名詞置換部30は、矛盾事態ペアデータベース18から得られる、共有名詞をもつ矛盾事態ペアの各々について、名詞関係データベース16から、当該矛盾事態ペアが持つ共有名詞の同位語を抽出し、取得した同位語により当該矛盾事態ペアの共有名詞を置き換えることで、矛盾事態ペアを作成する。   The single noun replacement unit 30 extracts and obtains, from each noun relation database 16, the common noun synonym of the contradiction pair for each contradiction pair having the common noun obtained from the contradiction pair database 18. The contradiction pair is created by replacing the common noun of the contradiction pair with the same isotope.

たとえば、以下の矛盾事態ペアがあったとする。   For example, consider the following inconsistency pair:

< 動物園の場所を調べない, 動物園に行く>
< テニスに興味がない, テニスをしたい>
<Do not check the zoo location, go to the zoo>
<I'm not interested in tennis, I want to play tennis>

ここから、単一名詞置換部30は以下の新たな矛盾事態ペアを作成する。   From here, the single noun replacement unit 30 creates the following new contradiction pair.

< 植物園の場所を調べない, 植物園に行く>
< ゴルフに興味がない, ゴルフをしたい>
<Do not check the location of the botanical garden, go to the botanical garden>
<I'm not interested in golf, I want to play golf>

ここで、「動物園」と「植物園」は同位語であり、「テニス」と「ゴルフ」は、どちらも国語辞典における「球技」を上位語に持つ同位語である。   Here, “zoo” and “botanical garden” are synonymous terms, and “tennis” and “golf” are both synonymous terms with “ball game” in the national language dictionary.

新しく作成された矛盾事態ペアはチェック部32に送られる。   The newly created contradiction pair is sent to the check unit 32.

チェック部32は、新しく作成された矛盾事態ペアの各々に対し、当該矛盾事態ペアに含まれる事態を表す文の各々について、大規模テキストコーパス34における当該事態を表す文の頻度が閾値以上であるかをチェックして、当該矛盾事態ペアに含まれる事態を表す文の各々の頻度が閾値以上であれば、矛盾事態ペアが適切であると判断し、データベース追加部36に送られる。   For each newly created contradiction pair, for each sentence representing a situation included in the contradiction pair, the check unit 32 has a frequency of the sentence representing the situation in the large-scale text corpus 34 equal to or greater than a threshold value. If the frequency of each sentence representing a situation included in the contradiction pair is equal to or greater than a threshold, it is determined that the contradiction pair is appropriate, and is sent to the database adding unit 36.

具体的には、新しく作成された矛盾事態ペアの前件(左側の文)、後件(右側の文)それぞれについて独立に大規模テキストコーパス34における出現回数をチェックし、どちらも閾値以上(たとえば、10回以上)の回数出現しているなら、この矛盾事態ペアが適切であると判断し、新しい矛盾事態ペアとして採用する。出現のチェックは、事態を表す述語項構造表現を一般的なWeb検索エンジン、もしくは、大規模なテキストから作成した検索インデックスでフレーズ検索することによって行う。検索は、表記の揺らぎを吸収するため,述語項構造表現をJUMAN代表表記に正規化して行ってもよい。   Specifically, the number of occurrences in the large text corpus 34 is independently checked for each of the antecedent (left sentence) and the subsequent (right sentence) of the newly created contradiction pair, If it appears more than 10 times), it is judged that this contradiction pair is appropriate and adopted as a new contradiction pair. Appearance is checked by searching for phrases in a predicate term structure expression representing the situation using a general Web search engine or a search index created from large-scale text. The search may be performed by normalizing the predicate term structure expression to the JUMAN representative notation in order to absorb the fluctuation of the notation.

なお、獲得したい矛盾事態ペアの量と精度との兼ね合いに基づいて、チェック部32の処理ステップはスキップしてもよい。その場合は、矛盾事態ペア作成部26によって新しく作成された矛盾事態ペアはそのままデータベース追加部36に送られる。   Note that the processing step of the check unit 32 may be skipped based on the balance between the amount and accuracy of the contradiction pair to be acquired. In that case, the contradiction pair newly created by the contradiction pair creation unit 26 is sent to the database addition unit 36 as it is.

データベース追加部36は、チェック部32から送られてきた矛盾事態ペアを矛盾事態ペアデータベース18に追加する。   The database adding unit 36 adds the contradiction pair sent from the check unit 32 to the contradiction pair database 18.

<矛盾作成装置の作用>
次に、本実施の形態に係る矛盾作成装置10の作用について説明する。矛盾作成装置10では、図2に示す矛盾作成処理ルーチンが実行される。
<Operation of contradiction creation device>
Next, the operation of the contradiction creation device 10 according to the present embodiment will be described. In the contradiction creation apparatus 10, the contradiction creation processing routine shown in FIG. 2 is executed.

まず、ステップS100において、第1知識ベース12A〜第3知識ベース12Cから、名詞ペアと当該名詞ペアの関係との組み合わせを各々取得して、名詞関係データベース16に記憶する。   First, in step S100, each combination of a noun pair and a relationship between the noun pair is acquired from the first knowledge base 12A to the third knowledge base 12C and stored in the noun relation database 16.

そして、ステップS102では、矛盾事態ペアデータベース18と名詞関係データベース16を照合し、矛盾事態ペアデータベース18において閾値以上の回数出現する、矛盾に関する名詞ペアの関係を抽出し、抽出した名詞ペアの関係を格納した関係リスト22を作成する。   In step S102, the contradiction pair database 18 and the noun relation database 16 are collated, the relation of the noun pairs related to the contradiction that appears in the contradiction pair database 18 more than a threshold value is extracted, and the relationship of the extracted noun pairs is determined. The stored relation list 22 is created.

ステップS104では、矛盾事態ペアデータベース18から、共有名詞をもたない矛盾事態ペアを取得する。ステップS106では、上記ステップS104で取得した、共有名詞をもたない矛盾事態ペアについて、当該矛盾事態ペアに含まれる名詞ペアの関係が、関係リスト22に含まれる場合、名詞ペアの関係と同じ関係を持つ名詞ペアを名詞関係データベース16から取得する。   In step S104, a contradiction pair having no shared noun is acquired from the contradiction pair database 18. In step S106, the relationship between the noun pairs included in the contradiction pair obtained in step S104 and having no shared noun is the same as the relationship between the noun pairs when the relationship list 22 includes the relationship. The noun pair having “” is acquired from the noun relation database 16.

そして、ステップS108において、上記ステップS106で取得した名詞ペアによって、上記ステップS104で取得した矛盾事態ペアの名詞ペアを置き換えることで矛盾事態ペアを作成する。   In step S108, a contradiction pair is created by replacing the noun pair of the contradiction pair acquired in step S104 with the noun pair acquired in step S106.

ステップS110では、上記ステップS108で作成した矛盾事態ペアに含まれる事態を表す文の各々について、大規模テキストコーパス34における当該事態を表す文の頻度が閾値以上であるかをチェックして、当該矛盾事態ペアに含まれる事態を表す文の各々の頻度が閾値以上であるか否かを判定する。当該矛盾事態ペアに含まれる事態を表す文の何れの頻度も閾値以上である場合には、作成した矛盾事態ペアが適切であると判断し、ステップS112へ移行する。   In step S110, for each sentence representing the situation included in the contradiction pair created in step S108, it is checked whether the frequency of the sentence representing the situation in the large-scale text corpus 34 is equal to or higher than a threshold value. It is determined whether the frequency of each sentence representing a situation included in the situation pair is equal to or higher than a threshold value. When any frequency of the sentence representing the situation included in the contradiction pair is equal to or higher than the threshold value, it is determined that the created contradiction pair is appropriate, and the process proceeds to step S112.

一方、当該矛盾事態ペアに含まれる事態を表す文の少なくとも一方の頻度が閾値未満である場合には、作成した矛盾事態ペアが適切でないと判断し、ステップS114へ移行する。   On the other hand, if the frequency of at least one of the sentences representing the situations included in the contradiction pair is less than the threshold, it is determined that the created contradiction pair is not appropriate, and the process proceeds to step S114.

ステップS112では、上記ステップS108で作成した矛盾事態ペアを、矛盾事態ペアデータベース18に追加する。   In step S112, the contradiction pair created in step S108 is added to the contradiction pair database 18.

ステップS112では、矛盾事態ペアデータベース18に格納されている、共有名詞をもたない矛盾事態ペアの全てについて、上記ステップS104〜S112の処理を実行したか否かを判定し、上記ステップS104〜S112の処理を実行していない、共有名詞をもたない矛盾事態ペアが存在する場合には、上記ステップS104へ戻り、当該矛盾事態ペアを取得する。   In step S112, it is determined whether or not the processing of steps S104 to S112 has been executed for all of the contradiction pairs having no shared noun stored in the contradiction pair database 18, and the steps S104 to S112 are performed. If there is a contradiction pair that does not execute the process and does not have a shared noun, the process returns to step S104 to acquire the contradiction pair.

一方、矛盾事態ペアデータベース18に格納されている、共有名詞をもたない矛盾事態ペアの全てについて、上記ステップS104〜S112の処理を実行した場合には、ステップS116へ進む。   On the other hand, when the processes of steps S104 to S112 are executed for all of the contradiction pair having no shared noun stored in the contradiction pair database 18, the process proceeds to step S116.

ステップS116では、矛盾事態ペアデータベース18から、共有名詞をもつ矛盾事態ペアを取得する。ステップS118では、名詞関係データベース16から、上記ステップS116で取得した矛盾事態ペアが持つ共有名詞の同位語を取得する。   In step S116, a contradiction pair having a common noun is acquired from the contradiction pair database 18. In step S118, the noun relation database 16 acquires the common noun synonyms of the contradiction pair acquired in step S116.

ステップS120では、上記ステップS118で取得した同位語により、上記ステップS116で取得した矛盾事態ペアの共有名詞を置き換えることで、矛盾事態ペアを作成する。   In step S120, a contradiction pair is created by replacing the common noun of the contradiction pair acquired in step S116 with the isotope acquired in step S118.

ステップS122では、上記ステップS120で作成した矛盾事態ペアに含まれる事態を表す文の各々について、大規模テキストコーパス34における当該事態を表す文の頻度が閾値以上であるかをチェックして、当該矛盾事態ペアに含まれる事態を表す文の各々の頻度が閾値以上であるか否かを判定する。当該矛盾事態ペアに含まれる事態を表す文の何れの頻度も閾値以上である場合には、作成した矛盾事態ペアが適切であると判断し、ステップS124へ移行する。   In step S122, for each sentence representing the situation included in the contradiction situation pair created in step S120, it is checked whether the frequency of the sentence representing the situation in the large-scale text corpus 34 is equal to or higher than a threshold value. It is determined whether the frequency of each sentence representing a situation included in the situation pair is equal to or higher than a threshold value. When any frequency of the sentence representing the situation included in the contradiction situation pair is equal to or higher than the threshold, it is determined that the created contradiction pair is appropriate, and the process proceeds to step S124.

一方、当該矛盾事態ペアに含まれる事態を表す文の少なくとも一方の頻度が閾値未満である場合には、作成した矛盾事態ペアが適切でないと判断し、ステップS126へ移行する。   On the other hand, if the frequency of at least one of the sentences representing the situations included in the contradiction pair is less than the threshold, it is determined that the created contradiction pair is not appropriate, and the process proceeds to step S126.

ステップS124では、上記ステップS120で作成した矛盾事態ペアを、矛盾事態ペアデータベース18に追加する。   In step S124, the contradiction pair created in step S120 is added to the contradiction pair database 18.

ステップS126では、矛盾事態ペアデータベース18に格納されている、共有名詞をもつ矛盾事態ペアの全てについて、上記ステップS116〜S124の処理を実行したか否かを判定し、上記ステップS116〜S124の処理を実行していない、共有名詞をもつ矛盾事態ペアが存在する場合には、上記ステップS116へ戻り、当該矛盾事態ペアを取得する。   In step S126, it is determined whether or not the processing of steps S116 to S124 has been executed for all of the conflicting pairs having shared nouns stored in the conflicting pair database 18, and the processing of steps S116 to S124 is performed. If there is a contradiction pair having a common noun that has not been executed, the process returns to step S116 to obtain the contradiction pair.

一方、矛盾事態ペアデータベース18に格納されている、共有名詞をもつ矛盾事態ペアの全てについて、上記ステップS116〜S124の処理を実行した場合には、矛盾作成処理ルーチンを終了する。   On the other hand, when the processes in steps S116 to S124 are executed for all the contradictory pairs having a common noun stored in the contradictory pair database 18, the contradiction creating process routine is terminated.

<矛盾事態ペアデータベースの拡張実験>
本発明の実施の形態に基づく手法を実行した結果、獲得できた矛盾事態ペアの一例は図3に示す通りである。図3のいずれもが、チェック部32を通過したものであり、それらは,すべて正しい矛盾事態ペアであった。
<Expansion experiment of contradiction pair database>
An example of a contradiction pair that can be acquired as a result of executing the technique based on the embodiment of the present invention is as shown in FIG. All of FIG. 3 passed through the check unit 32, and they were all correct contradiction pairs.

また、チェック部32により除外された例として、< 市が好きでない, 政令指定都市にハマる> がある。これは、< 寿司が好きでない, 回転寿司にハマる>から、(政令指定都市, is-a, 市) の関係によって生成されるが、「政令指定都市にハマる」は大規模テキストコーパス34において出現回数が少なかったため、チェック部32によって除外され、正しく獲得されなかった。   Further, as an example excluded by the check unit 32, there is <I do not like city, I am addicted to a government-designated city>. This is generated by the relationship of (decree-designated city, is-a, city) from <I do not like sushi, addicted to conveyor belt sushi>, but "added to the government-designated city" appears in the large text corpus 34 Since the number of times was small, it was excluded by the check unit 32 and was not acquired correctly.

以上説明したように、本実施の形態に係る矛盾作成装置によれば、矛盾に関する名詞ペアの関係を抽出して関係リストを作成し、矛盾事態ペアデータベースから得られた矛盾事態ペアに含まれる名詞ペアの関係が、関係リストに含まれる場合、名詞ペアの関係と同じ関係を持つ名詞ペアを名詞関係データベースから取得し、取得した名詞ペアによって矛盾事態ペアの名詞ペアを置き換えることで、新しい矛盾事態ペアを作成できる。   As described above, according to the contradiction creating apparatus according to the present embodiment, the noun pair included in the contradiction pair obtained from the contradiction pair is created by extracting the relationship between the noun pairs related to the contradiction and creating the relation list. If the relationship of a pair is included in the relationship list, a new inconsistency can be obtained by acquiring a noun pair having the same relationship as the relationship of the noun pair from the noun relationship database and replacing the noun pair of the inconsistency pair with the acquired noun pair. Pairs can be created.

また、矛盾事態ペアデータベースから、共有名詞を持つ矛盾事態ペアを取得し、名詞関係データベースから、取得した矛盾事態ペアが持つ共有名詞の同位語を抽出し、取得した同位語により矛盾事態ペアの共有名詞を置き換えることで、新しい矛盾事態ペアを作成できる。   In addition, a contradiction pair having a common noun is obtained from the contradiction pair database, a synonym of the common noun possessed by the obtained contradiction pair is extracted from the noun relation database, and the contradiction pair is shared by the obtained isotope. By replacing nouns, you can create new contradictory pairs.

また、矛盾事態ペアデータベースが拡張されることにより、言語生成システムにおいて、矛盾しない発話の生成が実現され、ユーザにとって理解しやすい文章がコンピュータによって生成されるようになる。これにより、人間の知的活動を促進することができる.   Further, by expanding the contradiction situation pair database, in the language generation system, generation of utterances without contradiction is realized, and sentences that are easy to understand for the user are generated by the computer. As a result, human intellectual activities can be promoted.

なお、本発明は、上記実施の形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。   The present invention is not limited to the above embodiment, and various modifications and applications can be made without departing from the gist of the present invention.

例えば、本願明細書中において、プログラムが予めインストールされている実施の形態として説明したが、外部の記憶装置や記録媒体等に格納されたプログラムを随時読み込んで、またインターネットを介してダウンロードして実行するようにしてもよい。また、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能である。   For example, in the present specification, the embodiment in which the program is installed in advance has been described. However, the program stored in an external storage device or recording medium is read as needed, and downloaded and executed via the Internet. You may make it do. In addition, the program can be provided by being stored in a computer-readable recording medium.

10 矛盾作成装置
12 知識ベース群
14 名詞関係取得部
16 名詞関係データベース
18 矛盾事態ペアデータベース
20 関係抽出部
22 関係リスト
24 矛盾事態ペア取得部
26 矛盾事態ペア作成部
28 名詞ペア置換部
30 単一名詞置換部
32 チェック部
34 大規模テキストコーパス
36 データベース追加部
DESCRIPTION OF SYMBOLS 10 Contradiction creation apparatus 12 Knowledge base group 14 Noun relation acquisition part 16 Noun relation database 18 Contradiction pair database 20 Relation extraction part 22 Relation list 24 Contradiction pair acquisition part 26 Contradiction pair creation part 28 Noun pair replacement part 30 Single noun Replacement unit 32 Check unit 34 Large text corpus 36 Database addition unit

Claims (7)

矛盾する事態を表す文のペアである矛盾事態ペアを格納した矛盾事態ペアデータベースと、名詞ペア及び前記名詞ペアの関係を格納した名詞関係データベースとを照合することで、矛盾に関する名詞ペアの関係を抽出し、抽出した名詞ペアの関係を格納した関係リストを作成する関係抽出部と、
前記矛盾事態ペアデータベースから得られる前記矛盾事態ペアについて、前記矛盾事態ペアに含まれる名詞ペアの関係が、前記関係リストに含まれる場合、前記名詞ペアの関係と同じ関係を持つ名詞ペアを前記名詞関係データベースから取得し、前記取得した名詞ペアによって前記矛盾事態ペアの名詞ペアを置き換えることで矛盾事態ペアを作成する名詞ペア置換部と、
を含む矛盾作成装置。
By comparing the contradiction pair database storing the contradiction pair, which is a pair of sentences representing the contradictory situation, and the noun relation database storing the relationship between the noun pair and the noun pair, the relationship of the noun pair related to the contradiction is obtained. A relationship extraction unit that extracts and creates a relationship list that stores relationships of extracted noun pairs;
For the contradiction pair obtained from the contradiction pair database, when the relationship of the noun pair included in the contradiction pair is included in the relationship list, a noun pair having the same relationship as the relationship of the noun pair is selected as the noun. A noun pair replacement unit that acquires from a relational database and creates a contradiction pair by replacing the noun pair of the contradiction pair by the acquired noun pair;
Contradiction creation device including
矛盾する事態を表す文のペアである矛盾事態ペアを格納した矛盾事態ペアデータベースから、前件と後件とで共通する共有名詞を持つ矛盾事態ペアを取得する矛盾事態ペア取得部と、
名詞ペア及び前記名詞ペアの関係を格納した名詞関係データベースから、前記矛盾事態ペア取得部によって取得した矛盾事態ペアが持つ共有名詞の同位語を抽出し、前記抽出した同位語により前記矛盾事態ペアの共有名詞を置き換えることで、矛盾事態ペアを作成する単一名詞置換部と、
を含む矛盾作成装置。
A contradiction pair acquisition unit that acquires a contradiction pair having a common noun in the antecedent and the consequent from the contradiction pair database storing a contradiction pair that is a pair of sentences representing a contradictory situation;
From the noun relation database storing the relationship between the noun pair and the noun pair, a common noun synonym of the contradiction pair acquired by the contradiction pair acquiring unit is extracted, and the contradiction pair A single noun replacement that creates a contradiction pair by replacing a shared noun,
Contradiction creation device including
前記作成された矛盾事態ペアに含まれる前記事態を表す文の各々について、大規模テキストコーパスにおける前記事態を表す文の頻度が閾値以上であるかをチェックして、前記作成された矛盾事態ペアに含まれる前記事態を表す文の各々の頻度が閾値以上であれば、前記矛盾事態ペアが適切であると判断するチェック部を更に含む請求項1又は2記載の矛盾作成装置。   For each sentence representing the situation included in the created contradiction pair, it is checked whether the frequency of the sentence representing the situation in the large-scale text corpus is equal to or higher than a threshold value. The contradiction creation device according to claim 1 or 2, further comprising a check unit that determines that the contradiction pair is appropriate if the frequency of each of the included sentences is equal to or greater than a threshold value. 関係抽出部及び名詞ペア置換部を含む矛盾作成装置における矛盾作成方法であって、
前記関係抽出部が、矛盾する事態を表す文のペアである矛盾事態ペアを格納した矛盾事態ペアデータベースと、名詞ペア及び前記名詞ペアの関係を格納した名詞関係データベースとを照合することで、矛盾に関する名詞ペアの関係を抽出し、抽出した名詞ペアの関係を格納した関係リストを作成し、
前記名詞ペア置換部が、前記矛盾事態ペアデータベースから得られる前記矛盾事態ペアについて、前記矛盾事態ペアに含まれる名詞ペアの関係が、前記関係リストに含まれる場合、前記名詞ペアの関係と同じ関係を持つ名詞ペアを前記名詞関係データベースから取得し、前記取得した名詞ペアによって前記矛盾事態ペアの名詞ペアを置き換えることで矛盾事態ペアを作成する
矛盾作成方法。
A contradiction creation method in a contradiction creation device including a relationship extraction unit and a noun pair replacement unit,
By comparing the contradiction pair database storing the contradiction pair that is a pair of sentences representing the contradictory situation and the noun relation database storing the relationship between the noun pair and the noun pair, To extract the relationship of the noun pairs for and create a relationship list that stores the relationships of the extracted noun pairs,
The noun pair replacement unit, for the contradiction pair obtained from the contradiction pair database, if the relationship of the noun pair included in the contradiction pair is included in the relationship list, the same relationship as the relationship of the noun pair A contradiction creating method of creating a contradiction pair by obtaining a noun pair having a noun pair from the noun relation database and replacing the noun pair of the contradiction pair with the acquired noun pair.
矛盾事態ペア取得部及び単一名詞置換部を含む矛盾作成装置における矛盾作成方法であって、
前記矛盾事態ペア取得部が、矛盾する事態を表す文のペアである矛盾事態ペアを格納した矛盾事態ペアデータベースから、前件と後件とで共通する共有名詞を持つ矛盾事態ペアを取得し、
前記単一名詞置換部が、名詞ペア及び前記名詞ペアの関係を格納した名詞関係データベースから、前記矛盾事態ペア取得部によって取得した矛盾事態ペアが持つ共有名詞の同位語を抽出し、前記抽出した同位語により前記矛盾事態ペアの共有名詞を置き換えることで、矛盾事態ペアを作成する
矛盾作成方法。
A contradiction creation method in a contradiction creation device including a contradiction situation pair acquisition unit and a single noun substitution unit,
The contradiction pair acquisition unit acquires a contradiction pair having a common noun common to the antecedent and the consequent from the contradiction pair database storing the contradiction pair that is a pair of sentences representing the contradictory situation,
The single noun replacement unit extracts the noun pairs and the noun relation database that stores the relationship between the noun pairs, and extracts the same nouns of the common nouns possessed by the contradiction pair acquired by the contradiction pair acquisition unit. A contradiction creation method for creating a contradiction pair by replacing a common noun of the contradiction pair with a synonym.
チェック部が、前記作成された矛盾事態ペアに含まれる前記事態を表す文の各々について、大規模テキストコーパスにおける前記事態を表す文の頻度が閾値以上であるかをチェックして、前記作成された矛盾事態ペアに含まれる前記事態を表す文の各々の頻度が閾値以上であれば、前記矛盾事態ペアが適切であると判断することを更に含む請求項4又は5記載の矛盾作成方法。   The check unit checks whether the frequency of the sentence representing the situation in the large-scale text corpus is greater than or equal to a threshold for each sentence representing the situation included in the created contradiction pair. The contradiction creation method according to claim 4 or 5, further comprising: determining that the contradiction pair is appropriate if the frequency of each sentence representing the situation included in the contradiction pair is equal to or greater than a threshold. コンピュータを、請求項1〜請求項3の何れか1項記載の矛盾作成装置を構成する各部として機能させるためのプログラム。   The program for functioning a computer as each part which comprises the contradiction creation apparatus of any one of Claims 1-3.
JP2015179839A 2015-09-11 2015-09-11 Contradiction creation device, method, and program Active JP6597958B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015179839A JP6597958B2 (en) 2015-09-11 2015-09-11 Contradiction creation device, method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015179839A JP6597958B2 (en) 2015-09-11 2015-09-11 Contradiction creation device, method, and program

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2019090844A Division JP6725925B2 (en) 2019-05-13 2019-05-13 Conflict creation device, method, and program

Publications (2)

Publication Number Publication Date
JP2017054434A true JP2017054434A (en) 2017-03-16
JP6597958B2 JP6597958B2 (en) 2019-10-30

Family

ID=58316715

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015179839A Active JP6597958B2 (en) 2015-09-11 2015-09-11 Contradiction creation device, method, and program

Country Status (1)

Country Link
JP (1) JP6597958B2 (en)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015121896A (en) * 2013-12-20 2015-07-02 国立研究開発法人情報通信研究機構 Phrase pair gathering device, and computer program for the same

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015121896A (en) * 2013-12-20 2015-07-02 国立研究開発法人情報通信研究機構 Phrase pair gathering device, and computer program for the same

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
高畠悠 他5名: "クラウドソーシングを活用した事態間矛盾の分析と分類", 言語処理学会第21回年次大会 発表論文集 [ONLINE], JPN6018018315, 9 March 2015 (2015-03-09), JP, pages 305 - 308, ISSN: 0003974868 *

Also Published As

Publication number Publication date
JP6597958B2 (en) 2019-10-30

Similar Documents

Publication Publication Date Title
US10496928B2 (en) Non-factoid question-answering system and method
JP6466952B2 (en) Sentence generation system
US20170308607A1 (en) Method and System for a Semantic Search Engine
Mulang et al. Matching natural language relations to knowledge graph properties for question answering
CN103229223A (en) Providing answers to questions using multiple models to score candidate answers
CN103229162A (en) Providing answers to questions using logical synthesis of candidate answers
Kim et al. Two-step cascaded textual entailment for legal bar exam question answering
KR20180125746A (en) System and Method for Sentence Embedding and Similar Question Retrieving
KR101508070B1 (en) Method for word sense diambiguration of polysemy predicates using UWordMap
CN109840255B (en) Reply text generation method, device, equipment and storage medium
CN106202206B (en) Source code function searching method based on software clustering
Van Durme et al. Open knowledge extraction through compositional language processing
JP2011118689A (en) Retrieval method and system
KR102292040B1 (en) System and method for extracting knowledge based on machine reading
JP6551968B2 (en) Implication pair expansion device, computer program therefor, and question answering system
CN111125355A (en) Information processing method and related equipment
JP6830971B2 (en) Systems and methods for generating data for sentence generation
Chen et al. A synergistic framework for geographic question answering
Kim et al. Design of question answering system with automated question generation
KR101706827B1 (en) Apparatus and method for extracting social relation between entity
JP6597958B2 (en) Contradiction creation device, method, and program
JP6725925B2 (en) Conflict creation device, method, and program
US20110106849A1 (en) New case generation device, new case generation method, and new case generation program
JP6106489B2 (en) Semantic analyzer and program
Veritawati et al. Text preprocessing using annotated suffix tree with matching keyphrase

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20150914

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170703

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20170703

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180514

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180522

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20180718

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180911

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20190212

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190513

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190614

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20190703

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190910

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190917

R150 Certificate of patent or registration of utility model

Ref document number: 6597958

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350