JP6327799B2 - 自然言語推論システム、自然言語推論方法及びプログラム - Google Patents
自然言語推論システム、自然言語推論方法及びプログラム Download PDFInfo
- Publication number
- JP6327799B2 JP6327799B2 JP2013108335A JP2013108335A JP6327799B2 JP 6327799 B2 JP6327799 B2 JP 6327799B2 JP 2013108335 A JP2013108335 A JP 2013108335A JP 2013108335 A JP2013108335 A JP 2013108335A JP 6327799 B2 JP6327799 B2 JP 6327799B2
- Authority
- JP
- Japan
- Prior art keywords
- text sentence
- data
- sentence
- word
- algebraic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 59
- 238000012545 processing Methods 0.000 claims description 55
- 238000000547 structure data Methods 0.000 claims description 32
- 238000004458 analytical method Methods 0.000 claims description 16
- 230000006870 function Effects 0.000 claims description 11
- 230000014509 gene expression Effects 0.000 description 19
- 235000019219 chocolate Nutrition 0.000 description 16
- 244000205754 Colocasia esculenta Species 0.000 description 12
- 235000006481 Colocasia esculenta Nutrition 0.000 description 12
- 238000006243 chemical reaction Methods 0.000 description 11
- 230000010365 information processing Effects 0.000 description 7
- 238000013507 mapping Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 241000972773 Aulopiformes Species 0.000 description 2
- 235000019515 salmon Nutrition 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000008094 contradictory effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 239000002023 wood Substances 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Description
例えば、文章Tと文章Hが次のものであるとする。
・文章T:川端康成は「雪国」などの作品でノーベル文学賞を受賞した。
・文章H:川端康成は「雪国」の作者である。
このような2つの文章Hと文章Tがあるとき、情報処理装置が文章Tと文章Hについて含意関係ありと推論するための演算処理手法は、容易に実現できるものではなかった。
構文解析部は、複数の単語よりなるテキスト文に含まれる述語を判断する処理を含む構文解析を行う。
木構造データ生成部は、構文解析部での構文解析の結果に基づいて、述語となる単語を中心として、述語とテキスト文内の他の単語を、単語の意味役割を示す記号を付加した辺で接続して自然言語文の論理的な構造を示す木構造のデータとする。
代数形式変換部は、木構造データ生成部が生成した第1のテキスト文の木構造のデータ及び第2のテキスト文の木構造のデータを、論理演算子で関係づけられた代数形式のデータに個別に変換する。
推論処理部は、代数形式変換部で代数形式に変換された、第1のテキスト文の代数形式のデータと、第2のテキスト文の代数形式のデータとの相違を比較するために、少なくとも一方の代数形式のデータを変形する推論処理を書き換え規則である公理に基づいて行う。
アライメント処理部は、推論処理部で推論した結果としての第1のテキスト文の代数形式のデータと第2のテキスト文の代数形式のデータとを比較して、含意関係の有無を判断するために、第1のテキスト文の木構造データの中心となる述語が含まれる候補部分と、第2のテキスト文の木構造データの中心となる述語が含まれる候補部分を探し出す。
分類部は、アライメント処理部で探し出された前記第1のテキスト文の述語が含まれる候補部分の単語と前記第2のテキスト文の述語が含まれる候補部分の単語との類似度を、言語知識リソース部に蓄積された言語知識を用いて判定する。
出力部は、分類部で判定された類似度に基づいて、第1のテキスト文と第2のテキスト文との含意関係の判定結果を出力する。
・複数の単語よりなるテキスト文に含まれる述語を判断する処理を含む構文解析を行うステップ。
・構文解析の結果に基づいて、述語となる単語を中心として、述語とテキスト文内の他の単語を、単語の意味役割を示す記号を付加した辺で接続して自然言語文の論理的な構造を示す木構造のデータとするステップ。
・木構造のデータとするステップで得られた、第1のテキスト文の木構造のデータ及び第2のテキスト文の木構造のデータを、論理演算子で関係づけられた代数形式のデータに個別に変換するステップ。
・変換するステップで変換された、第1のテキスト文の代数形式のデータと、第2のテキスト文の代数形式のデータとの相違を比較するために、少なくとも一方の代数形式のデータを変形する推論処理を書き換え規則である公理に基づいて行うステップ。
・推論処理で推論した結果としての第1のテキスト文の代数形式のデータと第2のテキスト文の代数形式のデータとを比較して、含意関係の有無を判断するために、第1のテキスト文の木構造データの中心となる述語が含まれる候補部分と、第2のテキスト文の木構造データの中心となる述語が含まれる候補部分を探し出すアライメント処理を行うステップ。
・アライメント処理で取り出されたアライメント処理部で探し出された第1のテキスト文の述語が含まれる候補部分の単語と第2のテキスト文の述語が含まれる候補部分の単語との類似度を、言語知識リソース部に蓄積された言語知識を用いて判定するステップ。
・判定するステップで得られた類似度に基づいて、第1のテキスト文と第2のテキスト文との含意関係の判定結果を出力するステップ。
・複数の単語よりなるテキスト文に含まれる述語を判断する処理を含む構文解析を行う手順。
・構文解析の結果に基づいて、前記述語となる単語を中心として、述語とテキスト文内の他の単語を、単語の意味役割を示す記号を付加した辺で接続して自然言語文の論理的な構造を示す木構造のデータとする手順。
・木構造のデータとする手順で得られた、第1のテキスト文の木構造のデータ及び第2のテキスト文の木構造のデータを、論理演算子で関係づけられた代数形式のデータに個別に変換する手順。
・変換する手順で変換された、第1のテキスト文の代数形式のデータと、第2のテキスト文の代数形式のデータとの相違を比較するために、少なくとも一方の代数形式のデータを変形する推論処理を書き換え規則である公理に基づいて行う手順。
・推論する手順で推論した結果としての第1のテキスト文の代数形式のデータと第2のテキスト文の代数形式のデータとを比較して、含意関係の有無を判断するために、第1のテキスト文の木構造データの中心となる述語が含まれる候補部分と、第2のテキスト文の木構造データの中心となる述語が含まれる候補部分を探し出すアライメント処理を行う手順。
・アライメント処理で取り出されたアライメント処理部で探し出された第1のテキスト文の述語が含まれる候補部分の単語と第2のテキスト文の述語が含まれる候補部分の単語との類似度を、言語知識リソース部に蓄積された言語知識を用いて判定する手順。
・判定する手順で得られた類似度に基づいて、第1のテキスト文と第2のテキスト文との含意関係の判定結果を出力する手順。
[1.システム構成例]
図1は、本例の自然言語推論システムの、情報処理機能から見た構成例を示す図である。
本例の自然言語推論システムは、例えばコンピュータとその周辺機器で構成され、コンピュータが備える演算処理機能やデータ記憶機能を使って、図1に示す自然言語推論システムの各処理部を構成する。
入力部11に入力されたテキスト文は、構文解析部12に供給され、構文解析処理が行われる。構文解析部12では、構文解析処理により、複数の単語よりなるテキスト文の構文の解析が行われる。また、この構文解析により、テキスト文に含まれる述語を判断する処理が行われる。
DCS木生成部13は、供給されるテキスト文の構文解析データに基づいて、DCS(Dependency-based Compositional Semantics)木と称される木構造のデータを生成する。DCS木は、それぞれの単語をノードとし、それぞれのノードを辺で接続した木構造のデータである。
木構造のデータとする際には、述語となる単語を中心として、他の単語を直接または間接的に辺で接続して、自然言語文の一階述語論理的な意味を定義する。すなわち、自然言語文の論理的な構造を検出して、その論理的な構造を、述語の単語から接続した木構造で示したものである。木構造のそれぞれの辺には、意味役割を示す記号(マーク)がラベル付けされる。また、ノードには選択子が付けられる場合があり、エッジには全称量化子マークがつけられる場合がある。さらに、ノードには、変数値を付加してもよい。DCS木の具体的な例については後述する。
代数形式変換部14は、DCS木のデータを代数形式のデータに変換する処理を行うものである。すなわち、代数形式変換部14では、DCS木が表現した意味の範囲を、代数形式で明確化する処理が行われる。具体的には、DCS木のデータが、予め決められた公理を適用して論理演算子で関係づけた代数形式のデータに変換される。この代数形式のデータの具体的な例については後述する。但し、後述する具体例は、比較的単純な文の例を示し、DCS木と代数形式の階層構造の間の類似性は、後述する具体例のように単純とは限らないが、本例の代数形式変換部14では、それがすべて解析されてどんなDCS木に対してもその意味を表す代数形式が自動的に生成される。
図2は、図1に示した自然言語推論システムで自然言語推論方法を実行する際の、データ処理の流れを示すフローチャートである。
図2にしたがって説明すると、まず自然言語文であるテキスト文が自然言語推論システムに入力されると、構文解析部12で構文解析処理が実行される(ステップS11)。この構文解析処理時には、テキスト文に含まれる述語の検索が行われる。
そして、表現アライメント部16で抽出された重要部分の単語のデータが、分類部17に供給され、比較対象となる自然言語文の重要部分の単語どうしが比較され、類似度が計算される(ステップS16)。分類部17で計算された類似度に基づいて、結果生成部18が判定結果を生成し、その生成された判定結果が出力部19から出力される(ステップS17)。
次に、代数形式変換部14で生成した代数形式を推論エンジン部15で推論処理を行う際に使用される公理の例を、以下に示す。それぞれの公理の後のカッコ内には、それぞれの公理の意味を示す。なお、すべて集合には次元があって、一次元の集合はWの部分集合、二次元の集合はW×Wの部分集合…となる。
(集合Wが空集合でない)
・公理2:A⊂W
(集合Aがn次元ならn個のWの直積に含まれる)
・公理3:A⊂A
(集合Aは集合Aに含まれる)
・公理4:(A⊂B&B⊂C)⇒A⊂C
(集合Aが集合Bに含まれ、かつ集合Bが集合Cに含まれるとき、集合Aは集合Cに含まれる)
・公理5:(A⊂B&B⊂A)⇒A=B
(集合Aが集合Bに含まれ、かつ集合Bが集合Aに含まれるとき、集合Aと集合Bは等しい)
・公理6:(A⊂B&A≠0)⇒B≠0
(集合Aが集合Bに含まれ、かつ集合Aが空集合でないとき、集合Bは空集合でない)
・公理7:A||B⇒B||A
(集合Aと集合Bが排他的(交わりが空集合)のとき、集合Bと集合Aも排他的)
・公理8:(A||B&C⊂A)⇒C||B
(集合Aと集合Bが排他的で、CがAに含まれるのとき、集合Cと集合Aも排他的)
・公理9:(A||A&A≠0)⇒⊥
(集合Aが自分自身と排他的でかつAが空集合でないとき、矛盾する)
・公理10:(A×B)×C=A×(B×C)
(集合Aと集合Bとの積にさらに集合Cとの積を求めたとき、集合Bと集合Cとの積に集合Aとの積を求めたものと一致する)
・公理11:πS(πR(A))=πS(A)
(πは射影を表す。この公理は、例えばAが三次元の時、集合Aの第1、2成分への射影をπR(A)で表すと、πR(A)の更に第1成分への射影πS(πR(A))は、集合Aの第1成分への射影πS(A)と等しい、ということを意味する。)
・公理12:(A∩B)∩C=A∩(B∩C)
(集合Aと集合Bの交わりと、さらに集合Cとの交わりは、集合Bと集合Cの交わりと、さらに集合Aとの交わりと一致する)
・公理13:π1((A×W)∩B)=A∩π1(B)
(ここで集合Aが一次元、集合Bが二次元と考える。(A×W)∩Bの第1成分への射影は、A∩π1(B)と等しい。他の次元数や成分に対しても同様に成り立つ。)
・公理14:A×B∩C×D=(A∩C)×(B∩D)
(集合Aと集合Bとの積と、集合Cと集合Dとの積との交わりは、集合Aと集合Cとの交わりと、集合Bと集合Dとの交わりの積と一致する)
・公理15:(A⊂C&B⊂D)⇒A×B⊂C×D
(集合Aが集合Bに含まれ、かつ集合Bが集合Dに含まれるとき、集合Aと集合Bとの積と、集合Cと集合Dと積の交わりと一致する)
・公理16:B≠0⇒π1(A×B)=A
(集合Bが空集合でないとき、集合Aと集合Bの射影は、集合Aと等しい)
・公理17:A⊂W1×W2⇒A⊂π1(A)×π2(A)
(集合Aが二次元の時、集合Aがπ1(A)×π2(A)の部分集合である。他の次元数に対しても同様)
・公理18:A⊂B⇒π(A)⊂π(B)
(集合Aが集合Bに含まれるとき、集合Aの射影も集合Bの同じ成分への射影に含まれる)
・公理19:A∩B⊂A
(集合Aと集合Bの交わりが集合Aの部分集合である)
・公理20:(C⊂A&C⊂B)⇒C⊂A∩B
(集合Cが集合Aに含まれ、かつ集合Cが集合Bに含まれるとき、集合Cは、集合Aと集合Bとの交わりに含まれる)
・公理21:B×q1 all(A,B)⊂A
(演算子q1 all の定義は、例えば集合Aが二次元で集合Bが一次元の時、集合q1 all(A,B)とは性質B×Y⊂Aを満たす最大の集合Yのことである。公理21と公理22は、この定義に対応する公理である。この演算子q1 all を使えば、全称量化子が入る文に対してもその意味を表現できる。)
・公理22:(B×C⊂A)⇒C⊂q1 all(A,B)
(集合Aが二次元で集合Bが一次元として、B×CがAに含まれるならば、Cがq1 all(A,B)に含まれる)
・公理23:A×B≠0⇔(A≠0&B≠0)
(集合Aと集合Bとの直積が空集合でないとき、集合Aが空集合でないと共に、集合Bが空集合でない)
・公理24:π(A)≠0⇔A≠0
(Aの射影が空集合でないこととAが空でないことは同値である)
・公理25:A||B⇒A×C||B×D
(AとBが排他的であれば任意のC、Dに対してA×CとB×Dも排他的である)
なお、公理1〜公理25は、適用される公理の一例であり、これ以外の公理を適用してもよい。
次に、2つの自然言語文を比較して、含意関係の有無を判定する具体的な3つの例について説明する。
最初に、含意関係ありと判定される2つの自然言語文T1,H1の例を、図3および図4を参照して説明する。
ここでの2つの自然言語文T1,H1は、以下の英文である。
自然言語文T1:
The watchdog International Atomic Energy Agency meets in Vienna on September 19.
自然言語文H1:
The International Atomic Energy Agency holds a meeting in Vienna.
自然言語文T1:
“meet”∩{(“watchdog”∩“IAEA”)דVienna”דSeptember 19 ”}≠0
自然言語文H1:
“hold”∩{“IAEA”×πARG(“meeting”∩(WדVienna”))}≠0
・“watchdog”⊂WARG
・“IAEA”⊂WARG
・“Vienna”⊂WARG
・“September 19 ”⊂WARG
・“meet”⊂WARG×WLOC×WTIME
・“meeting”⊂WARG×WLOC
これは、代数形式で以下のように表現される。
∀x,πLOC(“meet”∩(x×WLOC×WTIME))⊂
πLOC(“meeting”∩{πOBJ(“hold” ∩(x“meeting”))×WLOC})
・(“watchdog” ∩“IAEA”)⊂“IAEA” [公理19に基づく]
・“Vienna”⊂W、“September 19 ”⊂W [公理2に基づく]
よって、次のようになる。
・“IAEA”דVienna” דSeptember 19 ”⊂“IAEA” ×W×W[公理15に基づく]
さらに、公理4,19,20に基づくことで、次のように示される。
・“meet”∩{(“watchdog” ∩“IAEA”)דVienna”דSeptember 19 ”}
⊂“meet” ∩(“IAEA”×W×W)
これに言語知識と公理4を適用することで、
・πLOC(Q)⊂
πLOC(“meeting”∩{πOBJ(“hold”∩(“IAEA”דmeeting”))×WLOC})
この式の右辺をRとおく。
公理13と公理19とより、
・πLOC(P)⊂“Vienna”
公理20より、
・πLOC(P)⊂“Vienna” ∩R
公理24と式T1とより、
・πLOC(P)≠0
よって、公理6に基づき、
・Vienna” ∩R≠0
・“Vienna”∩R=
πLOC(“meeting”∩{πOBJ(“hold”∩(“IAEA”דmeeting”))דVienna”})
この式において、右辺は公理6より空集合ではない。
よって、公理24と公理19と公理6より、下記のようになる。
・πLOC( “hold”∩(“IAEA”דmeeting”))דVienna”≠0
さらに、公理13と公理24と公理14とより、
・“hold”∩{“IAEA”×πARG(“meeting”∩(WדVienna”))}≠0
次に、含意関係なしと判定される2つの自然言語文T2,H2の例を、図5および図6を参照して説明する。
ここでの2つの自然言語文T2,H2
は、以下の英文である。
自然言語文T2:
Jack Straw, the Foreign Secretary, will meet his Brazilian counterpart,Celso Amorim, in London today.
自然言語文H2:
Jack Straw is a partner of Celso Amorim.
図6は、自然言語文T2をDCS木で示したものである。この図5に示す例では、文T2の述語である「partner」のノードが元になり、この「partner」のノードが、辺を介した他の単語のノードと接続されたDCS木となっている。
自然言語文T2:
“meet”∩{(“Jack Straw”∩“Foreign Secretary”)×πARG(S)×today”}≠0
自然言語文H2:
“partner”∩(“Jack Straw”דCelso Amorim”)≠0
なお、文T2の代数形式のSは、以下のように定義される。
S=“counterpart”∩{“Celso Amorim”×(“his”∩“Brazilian”)דLondon”}
である。
∀x,πOBJ(“meet”∩(x×WOBJ))⊂πPOSS(“partner”∩(x×WPOSS))
∀y,πSBJ(“meet”∩(WSBJ×y))⊂πARG(“partner”∩(WARG×y))
この2つの式は、「x−“meet”−y⇒x−“partner”−y」に対応する知識を示している。ここでの∀xや∀yは、要素xや要素yが、それぞれの式で示される条件が成立することを仮定することを示す。
次に、DCS木に全称量化子マークがつけられる場合の例を、図7を参照して説明する。この例は、以下の2つの日本語の自然言語文T3,H3の例である。この例では、文T3が文H3を含意する場合の例である。
自然言語文T3:
すべての子供に愛されるチョコレートは苺味。
自然言語文H3:
子供の太郎は苺味のチョコレートを愛する。
自然言語文T3:
“苺味”∩“チョコレート”∩q1 all(“愛する”,“子供”)≠0
自然言語文H3:
“愛する”∩{(“太郎”∩“子供”)×(“チョコレート”∩“苺味”)}≠0
・“子供”⊂ WARG
・“太郎”⊂ WARG
・“苺味”⊂ WARG
・“チョコレート”⊂ WARG
・“愛する”⊂ WSBJ×WOBJ
・“子供”× q1 all(“愛する”,“子供”)⊂(“愛する”) [公理21より]
・{(“太郎” ∩“子供”)×(“チョコレート”∩“苺味”)}を、上式の両辺と交わりをとって、公理19,公理15,公理4を適用することで、
・(“子供”∩“太郎”)×{“苺味”∩“チョコレート”∩q1 all(“愛する”,“子供”)}⊂“愛する”∩{(“太郎”∩“子供”)×(“チョコレート”∩“苺味”)}
・文T3より“苺味”∩“チョコレート”∩q1 all(“愛する”,“子供”) ≠0
・条件より“太郎” ∩“子供” ≠0
・よって、公理23および公理6より、
“愛する” ∩{(“太郎” ∩“子供”)×(“チョコレート”∩“苺味”)}≠0
したがって、文T3が文H3を含意することが証明される。
なお、ここまでの実施の形態の例で説明したDCS木の生成処理や、代数形式に変換する際に適用する公理などは、一例を示したものであり、それぞれの例で示したものに限定されるものではない。例えば、DCS木以外の木構造データを生成する木構造データ生成部を用意して、本例の自然言語推論システムに適用してもよい。
また、図1に示した自然言語推論システムの構成についても、一例を示したものであり、その他の構成で同様の処理を行うようにしてもよい。例えば、言語知識リソース部20は、言語知識を記憶したデータベース部としたが、自然言語推論システムを構成するコンピュータが、インターネットなどを経由して、外部のサーバとアクセスして、言語知識を取得するようにしてもよい。
ここで、コンピュータ装置1が何らかのネットワーク4を経由して、サーバ5にアクセスして、サーバ5側に用意された言語知識のデータベースを参照することで、コンピュータ装置1が言語知識を取得するようにしてもよい。
あるいは、コンピュータ装置1は、含意関係の判定を行う2つの自然言語文の入力と判定結果の出力だけを行い、含意関係の判定に必要な演算処理の全てまたは一部を、サーバ5が行うようにしてもよい。
また、自然言語推論システムとして作動するコンピュータは、どのような形態の情報処理装置でもよい。例えば、スマートフォンと称されるアプリケーションプログラムの実装が可能な端末装置に、本例の自然言語推論処理を実行するプログラムを実装して、含意関係の推論処理を行うようにしてもよい。
Claims (3)
- コンピュータが持つ演算処理機能により自然言語の推論を行う自然言語推論システムであり、
前記コンピュータの演算処理機能として構成される処理部は、
複数の単語よりなるテキスト文に含まれる述語を判断する処理を含む構文解析を行う構文解析部と、
前記構文解析部での構文解析の結果に基づいて、前記述語となる単語を中心として、前記述語と前記テキスト文内の他の単語を、前記単語の意味役割を示す記号を付加した辺で接続して自然言語文の論理的な構造を示す木構造のデータとする木構造データ生成部と、
前記木構造データ生成部が生成した第1のテキスト文の木構造のデータ及び第2のテキスト文の木構造のデータを、論理演算子で関係づけられた代数形式のデータに個別に変換する代数形式変換部と、
前記代数形式変換部で変換された、前記第1のテキスト文の代数形式のデータと、前記第2のテキスト文の代数形式のデータとの相違を比較するために、少なくとも一方の代数形式のデータを変形する推論処理を書き換え規則である公理に基づいて行う推論処理部と、
前記推論処理部で推論した結果としての前記第1のテキスト文の代数形式のデータと前記第2のテキスト文の代数形式のデータとを比較して、含意関係の有無を判断するために、前記第1のテキスト文の木構造データの中心となる述語が含まれる候補部分と、前記第2のテキスト文の木構造データの中心となる述語が含まれる候補部分を探し出すアライメント処理部と、
前記アライメント処理部で探し出された前記第1のテキスト文の述語が含まれる候補部分の単語と前記第2のテキスト文の述語が含まれる候補部分の単語との類似度を、言語知識リソース部に蓄積された言語知識を用いて判定する分類部と、
前記分類部で判定された類似度に基づいて、前記第1のテキスト文と前記第2のテキスト文との含意関係の判定結果を出力する出力部と、を備える
自然言語推論システム。 - コンピュータが持つ演算処理機能により自然言語の推論を実行する自然言語推論方法であり、
複数の単語よりなるテキスト文に含まれる述語を判断する処理を含む構文解析を行うステップと、
前記構文解析の結果に基づいて、前記述語となる単語を中心として、前記述語と前記テキスト文内の他の単語を、前記単語の意味役割を示す記号を付加した辺で接続して自然言語文の論理的な構造を示す木構造のデータとするステップと、
前記木構造のデータとするステップで得られた、第1のテキスト文の木構造のデータ及び第2のテキスト文の木構造のデータを、論理演算子で関係づけられた代数形式のデータに個別に変換するステップと、
前記変換するステップで変換された、前記第1のテキスト文の代数形式のデータと、前記第2のテキスト文の代数形式のデータとの相違を比較するために、少なくとも一方の代数形式のデータを変形する推論処理を書き換え規則である公理に基づいて行うステップと、
前記推論処理で推論した結果としての前記第1のテキスト文の代数形式のデータと前記第2のテキスト文の代数形式のデータとを比較して、含意関係の有無を判断するために、前記第1のテキスト文の木構造データの中心となる述語が含まれる候補部分と、前記第2のテキスト文の木構造データの中心となる述語が含まれる候補部分を探し出すアライメント処理を行うステップと、
前記アライメント処理で探し出された前記第1のテキスト文の述語が含まれる候補部分の単語と前記第2のテキスト文の述語が含まれる候補部分の単語との類似度を、言語知識リソース部に蓄積された言語知識を用いて判定するステップと、
前記判定するステップで得られた類似度に基づいて、前記第1のテキスト文と前記第2のテキスト文との含意関係の判定結果を出力するステップと、を含む
自然言語推論方法。 - コンピュータにテキスト文の含意関係の判定を実行させるためのプログラムであり、
前記コンピュータが持つ演算処理機能により自然言語の推論をプログラムが実行するための手順として、
複数の単語よりなるテキスト文に含まれる述語を判断する処理を含む構文解析を行う手順と、
前記構文解析の結果に基づいて、前記述語となる単語を中心として、前記述語と前記テキスト文内の他の単語を、前記単語の意味役割を示す記号を付加した辺で接続して自然言語文の論理的な構造を示す木構造のデータとする手順と、
前記木構造のデータとする手順で得られた、第1のテキスト文の木構造のデータ及び第2のテキスト文の木構造のデータを、論理演算子で関係づけられた代数形式のデータに個別に変換する手順と、
前記変換する手順で変換された、前記第1のテキスト文の代数形式のデータと、前記第2のテキスト文の代数形式のデータとの相違を比較するために、少なくとも一方の代数形式のデータを変形する推論処理を書き換え規則である公理に基づいて行う手順と、
前記推論する手順で推論した結果としての前記第1のテキスト文の代数形式のデータと前記第2のテキスト文の代数形式のデータとを比較して、含意関係の有無を判断するために、前記第1のテキスト文の木構造データの中心となる述語が含まれる候補部分と、前記第2のテキスト文の木構造データの中心となる述語が含まれる候補部分を探し出すアライメント処理を行う手順と、
前記アライメント処理で探し出された前記第1のテキスト文の述語が含まれる候補部分の単語と前記第2のテキスト文の述語が含まれる候補部分の単語との類似度を、言語知識リソース部に蓄積された言語知識を用いて判定する手順と、
前記判定する手順で得られた類似度に基づいて、前記第1のテキスト文と前記第2のテキスト文との含意関係の判定結果を出力する手順と、をコンピュータに実行させるための
プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013108335A JP6327799B2 (ja) | 2013-05-22 | 2013-05-22 | 自然言語推論システム、自然言語推論方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013108335A JP6327799B2 (ja) | 2013-05-22 | 2013-05-22 | 自然言語推論システム、自然言語推論方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014229078A JP2014229078A (ja) | 2014-12-08 |
JP6327799B2 true JP6327799B2 (ja) | 2018-05-23 |
Family
ID=52128872
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013108335A Expired - Fee Related JP6327799B2 (ja) | 2013-05-22 | 2013-05-22 | 自然言語推論システム、自然言語推論方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6327799B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6726638B2 (ja) * | 2017-05-11 | 2020-07-22 | 日本電信電話株式会社 | 含意認識装置、方法、及びプログラム |
JP7088490B2 (ja) * | 2018-05-21 | 2022-06-21 | 日本電信電話株式会社 | 文比較装置、方法、及びプログラム |
CN111353305A (zh) * | 2018-12-21 | 2020-06-30 | 核动力运行研究所 | 基于自然语言识别的规程自动化执行方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000125197A (ja) * | 1998-10-13 | 2000-04-28 | Sony Corp | 画像生成方法及び装置 |
CN103221947B (zh) * | 2011-10-20 | 2016-05-25 | 日本电气株式会社 | 文本含意辨认装置、文本含意辨认方法和计算机可读记录介质 |
-
2013
- 2013-05-22 JP JP2013108335A patent/JP6327799B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2014229078A (ja) | 2014-12-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10262062B2 (en) | Natural language system question classifier, semantic representations, and logical form templates | |
KR101306667B1 (ko) | 지식 그래프 정제 장치 및 방법 | |
US10671929B2 (en) | Question correction and evaluation mechanism for a question answering system | |
US9607035B2 (en) | Extensible validation framework for question and answer systems | |
US9448995B2 (en) | Method and device for performing natural language searches | |
US9373075B2 (en) | Applying a genetic algorithm to compositional semantics sentiment analysis to improve performance and accelerate domain adaptation | |
US9147007B2 (en) | Query expression conversion apparatus, query expression conversion method, and computer program product | |
KR101107760B1 (ko) | 지능형 질의 응답 검색 시스템 및 방법 | |
US11170660B2 (en) | Harvesting question/answer training data from watched hypotheses in a deep QA system | |
US10140272B2 (en) | Dynamic context aware abbreviation detection and annotation | |
KR102491172B1 (ko) | 자연어 질의응답 시스템 및 그 학습 방법 | |
US10503830B2 (en) | Natural language processing with adaptable rules based on user inputs | |
JP2020509486A (ja) | 適応可能な処理コンポーネント | |
US9697099B2 (en) | Real-time or frequent ingestion by running pipeline in order of effectiveness | |
US9720962B2 (en) | Answering superlative questions with a question and answer system | |
US10282678B2 (en) | Automated similarity comparison of model answers versus question answering system output | |
US10628749B2 (en) | Automatically assessing question answering system performance across possible confidence values | |
Albarghothi et al. | Arabic question answering using ontology | |
US20220414463A1 (en) | Automated troubleshooter | |
US20170124475A1 (en) | Cognitive Visual Debugger that Conducts Error Analysis for a Question Answering System | |
JP6327799B2 (ja) | 自然言語推論システム、自然言語推論方法及びプログラム | |
Zhang et al. | Automatically reproducing android bug reports using natural language processing and reinforcement learning | |
JP2008021270A (ja) | データ変換装置および方法、データベース管理装置および方法、ならびにデータベース検索システムおよび方法 | |
JP7114433B2 (ja) | 名称マッチング装置及び方法 | |
KR20120070713A (ko) | 자연어 및 수식 색인화 방법과 그를 위한 장치 및 컴퓨터로 읽을 수 있는 기록매체 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160329 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20161228 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170207 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170407 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170905 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171013 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180410 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180417 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6327799 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |