JP2018036725A - 整合性判定装置、方法、及びプログラム - Google Patents

整合性判定装置、方法、及びプログラム Download PDF

Info

Publication number
JP2018036725A
JP2018036725A JP2016167248A JP2016167248A JP2018036725A JP 2018036725 A JP2018036725 A JP 2018036725A JP 2016167248 A JP2016167248 A JP 2016167248A JP 2016167248 A JP2016167248 A JP 2016167248A JP 2018036725 A JP2018036725 A JP 2018036725A
Authority
JP
Japan
Prior art keywords
sentence
sentences
similarity
consistency
term structure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016167248A
Other languages
English (en)
Other versions
JP6665061B2 (ja
Inventor
東中 竜一郎
Ryuichiro Higashinaka
竜一郎 東中
弘晃 杉山
Hiroaki Sugiyama
弘晃 杉山
貴之 堯天
Takayuki Gyoten
貴之 堯天
佳文 植田
Yoshifumi Ueda
佳文 植田
博順 平
Hiroyori Taira
博順 平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2016167248A priority Critical patent/JP6665061B2/ja
Publication of JP2018036725A publication Critical patent/JP2018036725A/ja
Application granted granted Critical
Publication of JP6665061B2 publication Critical patent/JP6665061B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】精度よく文章間の整合性を判定することができる。
【解決手段】文類似度算出部40が、二つの文章のうちの一方の文章の文の各々と、二つの文章のうちの他方の文章の文の各々との組み合わせの各々について、照応解析結果と、否定表現の判定結果と、推量表現の判定結果とに基づいて、文の類似度を算出する。PAS類似度算出部42が、一方の文章の文の各々について得られた述語項構造と、他方の文章の文の各々について得られた述語項構造との組み合わせの各々について、照応解析結果と、否定判定部36の判定結果と、推量判定部38の判定結果とに基づいて、述語項構造の類似度を算出する。類似度統合部44が、算出された文の類似度と、算出された述語項構造の類似度とを統合し、二つの文章間の整合性を判定する。
【選択図】図1

Description

本発明は、整合性判定装置、方法、及びプログラムに係り、特に、入力された二つの文章間の整合性を判定する整合性判定装置、方法、及びプログラムに関する。
ある文章Aが与えられたとき、別の文章BがAの内容と整合しているかを判定することは重要な課題である。このような判定ができれば、大規模な文書集合から、ある文が表す内容の真偽を自動的に確かめることができたり、ある文章について、人間が書いた要約文が誤っていないかといった自動的なチェックにも用いることができる。あるテキストT(テキスト)が与えられた時、別のテキストH(仮説、hypothesis)の内容を導くことができるかどうかという課題を含意関係認識という。文章の整合性判定は含意関係認識と近いものである。含意関係認識は、海外ではPASCAL Challenge(非特許文献1)、国内ではRITE(非特許文献2)という評価型ワークショップも開催され、様々な手法が検討されてきた。
Dagan, Ido, Oren Glickman, and Bernardo Magnini. "The PASCAL recognising textual entailment challenge." Machine learning challenges. evaluating predictive uncertainty, visual object classication, and recognising tectual entailment.Springer Berlin Heidelberg, 2006. 177-190. Watanabe, Yotaro, et al. "Overview of the Recognizing Inference in Text (RITE-2) at NTCIR-10." NTCIR. 2013.
しかしながら、文章の整合性は必ずしも含意関係のみで決まるわけではない。含意関係では、Tから論理的にHを帰結として導くことが出来るかが問題になるのに対し、整合性の場合は、その他の関係性も含みうる。たとえば、一方の文章がもう一方の一般化についてであったり、例示になっていたり、想像できる内容(必ずしも真ではない)であったりと、様々な場合が考えられる。よって、整合性判定は含意認識より範囲が広く、一般により難しいタスクと言える。
整合性判定において、二つの文章の意味内容を比較する際、最も広く用いられる手法は、二つの文章の単語の重複度合い、もしくは、単語の意味的類似度を計算し、十分(ある閾値以上)重複していると考えられる時は、整合性ありと判定するものである。
しかし、単語の重複や意味的類似度に着目するだけでは、大きく意味を変える(もしくは反転させる)単語が一方に含まれている場合に問題が起きる。たとえば、“I go to the movies”と“I never go to the movies”という二文は全く逆の意味を持つが、単語に基づく意味的類似性は高い。よって、この例のように、否定を表す単語(never)が一方に入っている場合、判定を誤ってしまう。また、“I go to the movies”と“I may go to the movies”においては、一方に推量を表す単語(may)が入っているが、「映画に行く」と「映画に行くかも知れない」は排他的なものではなく、整合性に影響を与えない可能性がある。しかし、単語の重複や意味的類似度は下がるため、全体として整合性を下げてしまう。
このように、否定や推量が文内に含まれる場合、従来の手法では、整合性判定が適切に行われない場合がある。
また、単語の重複や意味的類似度を比較する場合、主語や目的語といった文法機能を区別しないと、整合性の見積もりを誤ってしまうという問題もある。たとえば、“cats like dogs”と“dogs like cats”は異なる意味を持つが、単語の重複や意味的類似度は非常に近いため、整合性の観点からは誤った判定をしてしまう。
本発明は、上記問題点を解決するために成されたものであり、精度よく文章間の整合性を判定することができる整合性判定装置、方法、及びプログラムを提供することを目的とする。
上記目的を達成するために、第1の発明に係る整合性判定装置は、入力された二つの文章間の整合性を判定する整合性判定装置であって、前記二つの文章に含まれる文の各々について、述語項構造解析を行って述語項構造を得る述語項構造解析部と、前記二つの文章のうちの一方の文章の文の各々と、前記二つの文章のうちの他方の文章の文の各々との組み合わせの各々について、文の類似度を算出する文類似度算出部と、前記一方の文章の文の各々について得られた述語項構造と、前記他方の文章の文の各々について得られた述語項構造との組み合わせの各々について、述語項構造の類似度を算出するPAS類似度算出部と、前記文類似度算出部によって算出された前記文の類似度と、前記PAS類似度算出部によって算出された前記述語項構造の類似度とを統合し、前記二つの文章間の整合性を判定する類似度統合部と、を含んで構成されている。
また、第1の発明に係る整合性判定装置において、前記二つの文章に含まれる前記文の各々について、否定表現が含まれているか否かを判定する否定判定部を更に含み、前記否定判定部による判定結果に基づいて、前記文類似度算出部による文の類似度、又は前記PAS類似度算出部による述語項構造の類似度の算出が行われるようにしてもよい。
また、第1の発明に係る整合性判定装置において、前記二つの文章に含まれる前記文の各々について、推量表現が含まれているか否かを判定する推量判定部を更に含み、前記推量判定部による判定結果に基づいて、前記文類似度算出部による文の類似度、又は前記PAS類似度算出部による述語項構造の類似度の算出が行われるようにしてもよい。
また、第2の発明に係る整合性判定装置は、入力された二つの文章間の整合性を判定する整合性判定装置であって、前記二つの文章に含まれる文の各々について、否定表現が含まれているか否かを判定する否定判定部と、前記二つの文章のうちの一方の文章の文の各々と、前記二つの文章のうちの他方の文章の文の各々との組み合わせの各々について、前記否定判定部による判定結果に基づいて、文の類似度を算出する文類似度算出部と、を含んで構成されている。
また、第3の発明に係る整合性判定装置は、入力された二つの文章間の整合性を判定する整合性判定装置であって、前記二つの文章に含まれる文の各々について、推量表現が含まれているか否かを判定する推量判定部と、前記二つの文章のうちの一方の文章の文の各々と、前記二つの文章のうちの他方の文章の文の各々との組み合わせの各々について、前記推量判定部による判定結果に基づいて、文の類似度を算出する文類似度算出部と、を含んで構成されている。
また、第4の発明に係る整合性判定装置は、入力された二つの文章間の整合性を判定する整合性判定装置であって、前記二つの文章に含まれる文の各々について、否定表現が含まれているか否かを判定する否定判定部と、前記二つの文章に含まれる文の各々について、推量表現が含まれているか否かを判定する推量判定部と、前記二つの文章のうちの一方の文章の文の各々と、前記二つの文章のうちの他方の文章の文の各々との組み合わせの各々について、前記否定判定部による判定結果と、前記推量判定部による判定結果とに基づいて、文の類似度を算出する文類似度算出部と、を含んで構成されている。
また、第5の発明に係る整合性判定装置は、入力された二つの文章間の整合性を判定する整合性判定装置であって、前記二つの文章に含まれる文の各々について、述語項構造解析を行って述語項構造を得る述語項構造解析部と、前記二つの文章に含まれる前記文の各々について、否定表現が含まれているか否かを判定する否定判定部と、前記二つの文章のうちの一方の文章の文の各々について得られた述語項構造と、前記二つの文章のうちの他方の文章の文の各々について得られた述語項構造との組み合わせの各々について、前記否定判定部による判定結果に基づいて、述語項構造の類似度を算出するPAS類似度算出部と、を含んで構成されている。
また、第6の発明に係る整合性判定装置は、入力された二つの文章間の整合性を判定する整合性判定装置であって、前記二つの文章に含まれる文の各々について、述語項構造解析を行って述語項構造を得る述語項構造解析部と、前記二つの文章に含まれる前記文の各々について、推量表現が含まれているか否かを判定する推量判定部と、前記二つの文章のうちの一方の文章の文の各々について得られた述語項構造と、前記二つの文章のうちの他方の文章の文の各々について得られた述語項構造との組み合わせの各々について、前記推量判定部による判定結果に基づいて、述語項構造の類似度を算出するPAS類似度算出部と、を含んで構成されている。
また、第7の発明に係る整合性判定装置は、入力された二つの文章間の整合性を判定する整合性判定装置であって、前記二つの文章に含まれる文の各々について、述語項構造解析を行って述語項構造を得る述語項構造解析部と、前記二つの文章に含まれる前記文の各々について、否定表現が含まれているか否かを判定する否定判定部と、前記二つの文章に含まれる前記文の各々について、推量表現が含まれているか否かを判定する推量判定部と、前記二つの文章のうちの一方の文章の文の各々について得られた述語項構造と、前記二つの文章のうちの他方の文章の文の各々について得られた述語項構造との組み合わせの各々について、前記否定判定部による判定結果と、前記推量判定部による判定結果とに基づいて、述語項構造の類似度を算出するPAS類似度算出部と、を含んで構成されている。
また、第1の発明に係る整合性判定装置は、前記二つの文章の各々に含まれる参照表現が参照する参照先の表現を取得する照応解析部を更に含み、前記文類似度算出部は、前記参照表現を照応解析部によって取得した前記参照先の表現に置き換えて文の類似度を算出し、前記PAS類似度算出部は、前記参照表現を照応解析部によって取得した前記参照先の表現に置き換えて述語項構造の類似度を算出するようにしてもよい。
また、第1又は第4の発明に係る整合性判定装置において、前記文類似度算出部は、以下(1)式に従って、前記一方の文章の文s1と、前記他方の文章の文s2との組み合わせについて、文の類似度を算出するようにしてもよい。
・・・(1)
ただし、sentsimは前記文の類似度を返す関数であり、cosは二つのベクトルに対するコサイン類似度を返す関数であり、vecは文をベクトルに変換する関数であり、unmatchは二つの引数が一致しないときに1を返す関数であり、negは文に否定表現が含まれる場合に1を返し、否定表現が含まれない場合に−1を返す関数であり、specは文に推量表現が含まれる場合に1を、推量表現が含まれない場合に−1を返す関数であり、α及びβは予め定められた重みである。
また、第1又は第7の発明に係る整合性判定装置において、前記PAS類似度算出部は、以下(2)式に従って、前記一方の文章の文について得られた述語項構造pas1と、前記他方の文章の文について得られた述語項構造pas2との組み合わせについて、述語項構造の類似度を算出するようにしてもよい。

・・・(2)
ただし、passimは前記述語項構造の類似度を返す関数であり、rolesは二つの述語項構造間で共通する意味役割の集合を返す関数であり、cosは二つのベクトルに対するコサイン類似度を返す関数であり、wordvecは述語項構造と意味役割を入力とし、前記述語項構造における前記意味役割に対応する単語のベクトルを返す関数であり、unmatchは二つの引数が一致しないときに1を返す関数であり、pasnegは、述語項構造に対応する単語からなる単語列に含まれる否定表現の有無を表し、passpecは、述語項構造に含まれる単語からなる単語列に対応する推量表現の有無を表し、γ及びδは予め定められた重みである。
第8の発明に係る整合性判定方法は、入力された二つの文章間の整合性を判定する整合性判定装置における整合性判定方法であって、述語項構造解析部が、前記二つの文章に含まれる文の各々について、述語項構造解析を行って述語項構造を得るステップと、文類似度算出部が、前記二つの文章のうちの一方の文章の文の各々と、前記二つの文章のうちの他方の文章の文の各々との組み合わせの各々について、文の類似度を算出するステップと、PAS類似度算出部が、前記一方の文章の文の各々について得られた述語項構造と、前記他方の文章の文の各々について得られた述語項構造との組み合わせの各々について、述語項構造の類似度を算出するステップと、類似度統合部が、前記文類似度算出部によって算出された前記文の類似度と、前記PAS類似度算出部によって算出された前記述語項構造の類似度とを統合し、前記二つの文章間の整合性を判定するステップと、を含んで実行することを特徴とする。
第9の発明に係る整合性判定方法は、入力された二つの文章間の整合性を判定する整合性判定装置における整合性判定方法であって、否定判定部が、前記二つの文章に含まれる文の各々について、否定表現が含まれているか否かを判定するステップと、文類似度算出部が、前記二つの文章のうちの一方の文章の文の各々と、前記二つの文章のうちの他方の文章の文の各々との組み合わせの各々について、前記否定判定部による判定結果に基づいて、文の類似度を算出するステップと、を含んで実行することを特徴とする。
第10の発明に係る整合性判定方法は、入力された二つの文章間の整合性を判定する整合性判定装置における整合性判定方法であって、推量判定部が、前記二つの文章に含まれる文の各々について、推量表現が含まれているか否かを判定するステップと、文類似度算出部が、前記二つの文章のうちの一方の文章の文の各々と、前記二つの文章のうちの他方の文章の文の各々との組み合わせの各々について、前記推量判定部による判定結果に基づいて、文の類似度を算出するステップと、を含んで実行することを特徴とする。
第11の発明に係る整合性判定方法は、入力された二つの文章間の整合性を判定する整合性判定装置における整合性判定方法であって、述語項構造解析部が、前記二つの文章に含まれる文の各々について、述語項構造解析を行って述語項構造を得るステップと、否定判定部が、前記二つの文章に含まれる前記文の各々について、否定表現が含まれているか否かを判定するステップと、PAS類似度算出部が、前記二つの文章のうちの一方の文章の文の各々について得られた述語項構造と、前記二つの文章のうちの他方の文章の文の各々について得られた述語項構造との組み合わせの各々について、前記否定判定部による判定結果に基づいて、述語項構造の類似度を算出するステップと、を含んで実行することを特徴とする。
第12の発明に係る整合性判定方法は、入力された二つの文章間の整合性を判定する整合性判定装置における整合性判定方法であって、述語項構造解析部が、前記二つの文章に含まれる文の各々について、述語項構造解析を行って述語項構造を得るステップと、推量判定部が、前記二つの文章に含まれる前記文の各々について、推量表現が含まれているか否かを判定するステップと、PAS類似度算出部が、前記二つの文章のうちの一方の文章の文の各々について得られた述語項構造と、前記二つの文章のうちの他方の文章の文の各々について得られた述語項構造との組み合わせの各々について、前記推量判定部による判定結果に基づいて、述語項構造の類似度を算出するステップと、を含んで実行することを特徴とする。
第13の発明に係るプログラムは、コンピュータを、第1〜第7の発明に係る整合性判定装置の各部として機能させるためのプログラムである。
本発明の整合性判定装置、方法、及びプログラムによれば、二つの文章に含まれる文の各々について、述語項構造解析を行って述語項構造を得て、二つの文章のうちの一方の文章の文の各々と、二つの文章のうちの他方の文章の文の各々との組み合わせの各々について、文の類似度を算出し、一方の文章の文の各々について得られた述語項構造と、他方の文章の文の各々について得られた述語項構造との組み合わせの各々について、述語項構造の類似度を算出し、算出された文の類似度と、算出された述語項構造の類似度とを統合し、二つの文章間の整合性を判定することにより、精度よく文章間の整合性を判定することができる、という効果が得られる。
本発明の実施の形態に係る整合性判定装置の構成を示すブロック図である。 否定表現の判定結果の一例を示す図である。 推量表現の判定結果の一例を示す図である。 本発明の実施の形態に係る整合性判定装置における整合性判定処理ルーチンを示すフローチャートである。
以下、図面を参照して本発明の実施の形態を詳細に説明する。
<本発明の実施の形態に係る整合性判定装置の構成>
まず、本発明の実施の形態に係る整合性判定装置の構成について説明する。図1に示すように、本発明の実施の形態に係る整合性判定装置100は、CPUと、RAMと、後述する整合性判定処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することが出来る。この整合性判定装置100は、機能的には図1に示すように入力部10と、演算部20と、出力部50とを備えている。
入力部10は、整合性を判定する対象となる二つの文章を受け付ける。
演算部20は、文分割部30と、照応解析部32と、述語項構造解析部34と、否定判定部36と、推量判定部38と、文類似度算出部40と、PAS類似度算出部42と、類似度統合部44とを含んで構成されている。
文分割部30は、入力部10で受け付けた二つの入力文章を文の各々に分割する。文の分割は分割規則に基づいてもよいし、機械学習に基づく手法を用いてもよい。今回は英語の文分割のツールとして、Stanford CoreNLPというツールの文分割機能を用いている。文分割部は、入力文章について一つ以上の文を出力する。Stanford CoreNLPは英語圏における言語処理のツールとして標準的に用いられているものである。
照応解析部32は、入力部10で受け付けた二つの入力文章の各々について、当該入力文章の照合解析を行って、当該入力文章に含まれる参照表現が参照する参照先の表現を取得し、照応解析結果とする。
例えば、heやsheといった参照表現が具体的に文章中のどの要素に対応するのかを見つける。ここでも、Stanford CoreNLP(手作業による規則を多段に用いる手法が用いられている)を用いる。参照先が複数単語からなる場合は、主要素とされる主辞の単語を用いる。
なお、non−referentialの“it”という現象がある。これは、“it is possible that he may come”といった文に見られるように、itが具体的なものを指すのではなく、いわゆる仮主語として用いられる場合である。このような場合は、itは参照先なしとみなすことが妥当である。よって、そのようなitについては、前段で対応する単語を得ていた場合、参照先を「なし」と修正する。このような“it”を特定する手法はいくつか提案されており、ここでは、以下の非特許文献3の手法を用いて特定する。
非特許文献3:Bergsma, Shane, and David Yarowsky. "NADA: A robust system for non-referential pronoun detection." Anaphora Processing and Applications. Springer Berlin Heidelberg, 2011. 12-23.
述語項構造解析部34は、以下に説明するように、入力部10で受け付けた二つの文章に含まれる文の各々について、述語項構造解析を行って、当該文に含まれる述語項構造を得る。
述語項構造解析部34では、Semantic Role Labeling(SRL、意味役割付与)とも呼ばれる処理によって、文を解析して述語とそれにまつわる項(主語や目的語)の組を出力する。この組のことを、predicate argument structure(PAS、述語項構造)と呼ぶ。
SRLを行うためには、Stanford CoreNLPが文に対して出力する依存構造から、動詞とそれに対する主語、目的語関係にある単語を抽出したり、HPSG理論に基づく文法による手法(非特許文献4)を用いたりすればよい。SRLには標準的なフリーソフトも存在するのでツールとしてそれらを用いればよい。標準的なツールでは、PASとしては様々な情報を出力することができるが、ここでは、述語(predと呼ぶ)、主語(arg1と呼ぶ)、目的語(arg2と呼ぶ)、その他2つまでの述語が取り得る格要素(arg3、arg4と呼ぶ。述語によって定義が異なる)の組を用いることとする。なお、PASの抽出において、項となる単語が、複数単語からなる場合はその主辞を用いて代表させる。pred、arg1−arg4は意味役割(もしくは、意味スロット)とも呼ばれる。
非特許文献4:Yusuke Miyao et al. “Task-oriented Evaluation of Syntactic Parsers and Their Representations” In: ACL. 2008. p. 46-54.
例えば、“I have a pen”であれば、[pred=have、arg1=I、arg2=pen、arg3=null、arg4=null]というPASを得る。ここで、nullは対応する単語がないことを表す。“I gave her a present”であれば、PASは[pred=gave、arg1=I、arg2=her、arg3=present、arg4=null]となる。最初の文において、arg2=a penとなっていないのは、主辞であるpenで代表させているからである。二つ目の文における、arg3=presentとなっている理由も同様である。
否定判定部36は、以下に説明するように、二つの文章に含まれる文の各々について、否定表現が含まれているか否かを判定する。
否定判定部36では、文を解析し、否定が含まれているかどうかを判定し、その結果(二値)を出力する。本発明の実施の形態では、否定の判定に機械学習の手法を用いる。具体的には、否定が含まれている文と否定が含まれていない文を多数用意し、一般的な機械学習に基づく文書分類の手法を用いて、二値分類器を学習する。そして、この分類器に文を入力し、分類結果を得る。
本発明の実施の形態では、約3万文(否定が含まれる文5000文、含まれない文25000文)の文章を学習データとして用意した。文を表す特徴量として、文中の単語unigram、bigram、trigramの素性を用いた。すなわち、文にそれぞれの素性が存在すれば、その素性の値を1とした。学習手法としては、ロジスティック回帰を用い、10分割交差検定で96%の性能で二値分類ができる分類器を学習した。この分類器を用いて、入力文について、否定表現が含まれるか否かを判定する。
図2にいくつかの入力文に対する否定表現の判定結果の例を示す。最後のカラムが入力文を示す。そして、最初のカラムが判定結果を示している。−1は否定が含まれていないことを示しており、1は否定が含まれていることを示す。二つ目と三つ目のカラムはそれぞれ否定が含まれないことに関する確率、否定が含まれることに関する確率である。この確率に基づき、判定結果が得られている。
推量判定部38は、以下に説明するように、二つの文章に含まれる文の各々について、推量表現が含まれているか否かを判定する。
推量判定部38では、文を解析し、推量表現が含まれているかどうかを判定し、その結果(二値)を出力する。
本発明の実施の形態では、約3万文(否定が含まれる文4000文、含まれない文26000文)の文章を学習データとして用意した。文を表す特徴量として、文中の単語unigram、bigram、trigramの素性を用いた。学習手法として、ロジスティック回帰を用い、10分割交差検定で95%の性能で二値分類ができる分類器を学習した。この分類器を用いて、入力文について、推量表現が含まれるか否かを判定する。
図3に、図2と同じ入力文に対する推量表現の判定結果の例を示す。最後のカラムが入力文を示す。そして、最初のカラムが判定結果を示している。−1は推量表現が含まれていないことを示しており、1は推量表現が含まれていることを示す。二つ目と三つ目のカラムはそれぞれ推量表現が含まれないことに関する確率、推量表現が含まれることに関する確率である。この確率に基づき、判定結果が得られている。例に示される通り、is likely toやprobablyなどが入っている文については推量表現が含まれることが適切に判定されている。
文類似度算出部40は、以下に説明するように、二つの文章のうちの一方の文章の文の各々(文集合1とする)と、二つの文章のうちの他方の文章の文の各々(文集合2とする)との組み合わせの各々について、照応解析部32による照応解析結果と、否定判定部36による判定結果と、推量判定部38による判定結果とに基づいて、文の類似度を算出する。
文類似度算出部40では、文集合1、文集合2、文それぞれに対する照応解析結果、否定判定部36による判定結果、及び推量判定部38による判定結果を入力とし、一方の文章の文s1と、他方の文章の文s2との組み合わせについて、文の類似度を計算する。文の類似度の計算式は以下の(1)式を用いる。
・・・(1)
ここで、sentsimは文の類似度を返す関数であり、cosは二つのベクトルに対するコサイン類似度を返す関数である。vecは文をベクトルに変換する関数である。この関数は文に含まれる単語のそれぞれに対応するベクトルを加算したものである。単語ベクトルは、単語をベクトルで表現する手法として一般的なword2vec(非特許文献5)で得られるものを用いる。ベクトルの次元は300次元である。
非特許文献5:Mikolov, Tomas, et al. "Distributed representations of words and phrases and their compositionality." Advances in neural information processing systems. 2013.
なお、各単語のベクトルはその単語のinverse document frequency(IDF)値によって重み付けを行って、IDF値が大きいほど大きな重みを掛け合わせる。IDF値は別途準備した新聞記事コーパスから得る。また、今回は文中のすべての単語を用いるが、ストップワードのリストを準備しておき、その単語については無視するといった処理を行ってもよい。ストップワードとしては、例えば、英語であれば「a」、「the」といったものであり、前置詞や定冠詞などである。また、文に参照表現が含まれる場合は、照応解析部32の照応解析結果に基づいて、当該参照表現を参照先の単語に置き換えた文を用いる。
unmatchは二つの引数が一致しないときに1を返す関数である。neg(negationの意)は文に否定表現が含まれる場合に1を、否定表現が含まれない場合に−1を返す関数であり、否定判定部36による判定結果を用いればよい。spec(speculationの意)は文に推量表現が含まれる場合に1を、推量表現が含まれない場合に−1を返す関数であり、推量判定部38による判定結果を用いればよい。
αとβは予め定められた加算処理をするときの重みである。例えば、−1.0と0.1を用いる。この場合、片方に否定表現があり、もう一方に否定表現がないときは類似度が大きく割り引かれる。また、片方に推量表現があり、もう片方に推量表現がない場合は、単語に基づく類似度が低くても一定の整合性が認められる場合があるため、類似度が一定程度割り増される。
以上の処理により、文類似度算出部40は、上記(1)式に従って、文集合1の文と文集合2の文のすべての組み合わせにおけるsentsimの最大値を出力する。
PAS類似度算出部42は、以下に説明するように、一方の文章の文の各々について得られた述語項構造(PAS集合1とする)と、他方の文章の文の各々について得られた述語項構造(PAS集合2とする)との組み合わせの各々について、照応解析部32による照応解析結果と、否定判定部36による判定結果と、推量判定部38による判定結果とに基づいて、PASの類似度を算出する。
PAS類似度算出部42では、PAS集合1、PAS集合2、PASのそれぞれと対応付いた文に対する照応解析結果、否定判定部36による判定結果、及び推量判定部38による判定結果を入力とし、一方の文章の文について得られた述語項構造pas1と、他方の文章の文について得られた述語項構造pas2との組み合わせについて、PASの類似度を計算する。
PASの類似度の計算式は以下(2)式を用いる。


・・・(2)
ここで、passimはPAS同士の類似度を返す関数であり、rolesは二つのPAS間で共通する意味役割(どちらにおいても値がnullではない意味役割)の集合を返す関数である。例えば、前述したように意味役割にはpred、arg1、arg2、arg3、及びarg4があるが、pas1にpred、及びarg1があり、pas2にpred、arg1、及びarg2がある場合、どちらにも共通なpred、及びarg1を返す。wordvecはPASと意味役割を入力とし、PASにおける意味役割に対応する単語のベクトルを返す。ここでの単語ベクトルは文類似度算出部40と同様、word2vecを参照することで得る。pasnegは、PASに対応する単語(PASに含まれる単語、若しくは、PASのpredを主辞とする動詞句に含まれる単語)からなる単語列に含まれる否定表現の有無を表し、否定判定部36と同様に求められる。passpecは、PASに対応する単語からなる単語列に含まれる推量表現の有無を表し、推量判定部38と同様に求められる。
なお、PAS中の単語に参照表現が含まれる場合は、照応解析部32による照応解析結果に基づいて、当該参照表現を、参照先の単語に置き換えたものを用いる。
γとδは予め定められた加算処理をするときの重みである。たとえば、0.4と0.1を用いる。
また、PASについての否定判定結果、推量判定結果を求める代わりに、PASが含まれる文の否定判定結果、推量判定結果で代用してもよい。その場合は、以下(3)式になる。ここで、sentはPASに紐付けられた文(述語項解析前の入力文)を返す関数である。
・・・(3)
以上の処理により、PAS類似度算出部42は、上記(2)式に従って、PAS集合1のPASとPAS集合2のPASのすべての組み合わせにおけるpassimの最大値を出力する。
類似度統合部44は、文類似度算出部40によって算出された文の類似度の最大値と、PAS類似度算出部42によって算出されたPASの類似度の最大値とを統合し、二つの文章間の整合性を判定する。本発明の実施の形態においては、二つの文章についての最終的な整合性スコアを出力する。二つの類似度の足し合わせはそのまま足し合わせてもよいし、重みをつけて足し合わせて整合性スコアを算出してもよい。文類似度算出部40、PAS類似度算出部42におけるα、β、γ、δ、及び類似度統合部44における重みは、開発データにおいて解きたい問題のパフォーマンスが最大になるように最適化を行うことが望ましい。例えば、所定の文章について整合性が予め分かっている複数の文章があるとき、最も整合性が高い文章の類似度が最大になるように最適化を行えばよい。
<本発明の実施の形態に係る整合性判定装置の作用>
次に、本発明の実施の形態に係る整合性判定装置100の作用について説明する。入力部10において二つの入力文章を受け付けると、整合性判定装置100は、図4に示す整合性判定処理ルーチンを実行する。
まず、ステップS100では、入力部10で受け付けた二つの入力文章を文の各々に分割する。
次に、ステップS102では、入力部10で受け付けた二つの入力文章の各々に含まれる参照表現が参照する参照先の表現を取得し、照応解析結果とする。
ステップS104では、入力部10で受け付けた二つの文章に含まれる文の各々について、述語項構造解析を行って述語項構造を得る。
ステップS106では、二つの文章に含まれる文の各々について、否定表現が含まれているか否かを判定する。
ステップS108では、二つの文章に含まれる文の各々について、推量表現が含まれているか否かを判定する。
ステップS110では、二つの文章のうちの一方の文章の文の各々と、二つの文章のうちの他方の文章の文の各々との組み合わせの各々について、ステップS102の照応解析結果と、ステップS106の判定結果と、ステップS108の判定結果とに基づいて、上記(1)式に従って、文の類似度を算出し、文の類似度の最大値を出力する。
ステップS112では、一方の文章の文の各々について得られた述語項構造と、他方の文章の文の各々について得られた述語項構造との組み合わせの各々について、ステップS102の照応解析結果と、ステップS106の判定結果と、ステップS108の判定結果とに基づいて、上記(2)式に従って、述語項構造の類似度を算出し、述語項構造の類似度の最大値を出力する。
ステップS114では、ステップS110で算出された文の類似度の最大値と、ステップS112で算出された述語項構造の類似度の最大値とを統合し、二つの文章間の整合性を判定し、整合性スコアを出力部50に出力して処理を終了する。
以上説明したように、本発明の実施の形態に係る整合性判定装置によれば、二つの文章に含まれる文の各々について、述語項構造解析を行って述語項構造を得て、二つの文章のうちの一方の文章の文の各々と、二つの文章のうちの他方の文章の文の各々との組み合わせの各々について、照応解析結果と、否定判定部36の判定結果と、推量判定部38の判定結果とに基づいて、文の類似度を算出し、一方の文章の文の各々について得られた述語項構造と、他方の文章の文の各々について得られた述語項構造との組み合わせの各々について、照応解析結果と、否定判定部36の判定結果と、推量判定部38の判定結果とに基づいて、述語項構造の類似度を算出し、算出された文の類似度と、算出された述語項構造の類似度とを統合し、二つの文章間の整合性を判定することにより、精度よく文章間の整合性を判定することができる。
なお、本発明は、上述した実施の形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
例えば、上述した実施の形態では、文類似度算出部40、及びPAS類似度算出部42は、最大値となる組み合わせを出力していたが、これに限定されるものではない。最大値以外にも、平均値を出力したり、最大値又は平均値を所定の閾値と比較した結果を二値で表したもの(例えば、最大値が閾値以上であれば1、閾値未満であれば0)を出力するようにしてもよい。
また、上述した実施の形態では、二つの文章を入力として整合性を判定していたがこれに限定されるものではない。例えば、複数の文を入力として、ある一文に最も整合する文を残りの文の中から抽出するようにしてもよい。また、ある一文に整合すると判定された全ての文を抽出するようにしてもよい。
また、上述した実施の形態では、否定判定部36の判定結果、及び推量判定部38の判定結果を文類似度算出部40、及びPAS類似度算出部42で用いていたが、これに限定されるものではなく、いずれか一方の判定結果を用いて、文の類似度を算出したり、述語項構造の類似度を算出するようにしてもよい。
また、上述した実施の形態では、文類似度算出部40、及びPAS類似度算出部42での類似度の算出を行っていたが、これに限定されるものではなく、いずれか一方の類似度の算出を行うようにしてもよく、この場合において、文類似度算出部40の出力、又はPAS類似度算出部42の出力をそのまま整合性スコアとすればよい。
10 入力部
20 演算部
30 文分割部
32 照応解析部
34 述語項構造解析部
36 否定判定部
38 推量判定部
40 文類似度算出部
42 PAS類似度算出部
44 類似度統合部
50 出力部
100 整合性判定装置

Claims (18)

  1. 入力された二つの文章間の整合性を判定する整合性判定装置であって、
    前記二つの文章に含まれる文の各々について、述語項構造解析を行って述語項構造を得る述語項構造解析部と、
    前記二つの文章のうちの一方の文章の文の各々と、前記二つの文章のうちの他方の文章の文の各々との組み合わせの各々について、文の類似度を算出する文類似度算出部と、
    前記一方の文章の文の各々について得られた述語項構造と、前記他方の文章の文の各々について得られた述語項構造との組み合わせの各々について、述語項構造の類似度を算出するPAS類似度算出部と、
    前記文類似度算出部によって算出された前記文の類似度と、前記PAS類似度算出部によって算出された前記述語項構造の類似度とを統合し、前記二つの文章間の整合性を判定する類似度統合部と、
    を含む整合性判定装置。
  2. 前記二つの文章に含まれる前記文の各々について、否定表現が含まれているか否かを判定する否定判定部を更に含み、
    前記否定判定部による判定結果に基づいて、前記文類似度算出部による文の類似度、又は前記PAS類似度算出部による述語項構造の類似度の算出が行われる請求項1に記載の整合性判定装置。
  3. 前記二つの文章に含まれる前記文の各々について、推量表現が含まれているか否かを判定する推量判定部を更に含み、
    前記推量判定部による判定結果に基づいて、前記文類似度算出部による文の類似度、又は前記PAS類似度算出部による述語項構造の類似度の算出が行われる請求項1又は請求項2に記載の整合性判定装置。
  4. 入力された二つの文章間の整合性を判定する整合性判定装置であって、
    前記二つの文章に含まれる文の各々について、否定表現が含まれているか否かを判定する否定判定部と、
    前記二つの文章のうちの一方の文章の文の各々と、前記二つの文章のうちの他方の文章の文の各々との組み合わせの各々について、前記否定判定部による判定結果に基づいて、文の類似度を算出する文類似度算出部と、
    を含む整合性判定装置。
  5. 入力された二つの文章間の整合性を判定する整合性判定装置であって、
    前記二つの文章に含まれる文の各々について、推量表現が含まれているか否かを判定する推量判定部と、
    前記二つの文章のうちの一方の文章の文の各々と、前記二つの文章のうちの他方の文章の文の各々との組み合わせの各々について、前記推量判定部による判定結果に基づいて、文の類似度を算出する文類似度算出部と、
    を含む整合性判定装置。
  6. 入力された二つの文章間の整合性を判定する整合性判定装置であって、
    前記二つの文章に含まれる文の各々について、否定表現が含まれているか否かを判定する否定判定部と、
    前記二つの文章に含まれる文の各々について、推量表現が含まれているか否かを判定する推量判定部と、
    前記二つの文章のうちの一方の文章の文の各々と、前記二つの文章のうちの他方の文章の文の各々との組み合わせの各々について、前記否定判定部による判定結果と、前記推量判定部による判定結果とに基づいて、文の類似度を算出する文類似度算出部と、
    を含む整合性判定装置。
  7. 入力された二つの文章間の整合性を判定する整合性判定装置であって、
    前記二つの文章に含まれる文の各々について、述語項構造解析を行って述語項構造を得る述語項構造解析部と、
    前記二つの文章に含まれる前記文の各々について、否定表現が含まれているか否かを判定する否定判定部と、
    前記二つの文章のうちの一方の文章の文の各々について得られた述語項構造と、前記二つの文章のうちの他方の文章の文の各々について得られた述語項構造との組み合わせの各々について、前記否定判定部による判定結果に基づいて、述語項構造の類似度を算出するPAS類似度算出部と、
    を含む整合性判定装置。
  8. 入力された二つの文章間の整合性を判定する整合性判定装置であって、
    前記二つの文章に含まれる文の各々について、述語項構造解析を行って述語項構造を得る述語項構造解析部と、
    前記二つの文章に含まれる前記文の各々について、推量表現が含まれているか否かを判定する推量判定部と、
    前記二つの文章のうちの一方の文章の文の各々について得られた述語項構造と、前記二つの文章のうちの他方の文章の文の各々について得られた述語項構造との組み合わせの各々について、前記推量判定部による判定結果に基づいて、述語項構造の類似度を算出するPAS類似度算出部と、
    を含む整合性判定装置。
  9. 入力された二つの文章間の整合性を判定する整合性判定装置であって、
    前記二つの文章に含まれる文の各々について、述語項構造解析を行って述語項構造を得る述語項構造解析部と、
    前記二つの文章に含まれる前記文の各々について、否定表現が含まれているか否かを判定する否定判定部と、
    前記二つの文章に含まれる前記文の各々について、推量表現が含まれているか否かを判定する推量判定部と、
    前記二つの文章のうちの一方の文章の文の各々について得られた述語項構造と、前記二つの文章のうちの他方の文章の文の各々について得られた述語項構造との組み合わせの各々について、前記否定判定部による判定結果と、前記推量判定部による判定結果とに基づいて、述語項構造の類似度を算出するPAS類似度算出部と、
    を含む整合性判定装置。
  10. 前記二つの文章の各々に含まれる参照表現が参照する参照先の表現を取得する照応解析部を更に含み、
    前記文類似度算出部は、前記参照表現を照応解析部によって取得した前記参照先の表現に置き換えて文の類似度を算出し、
    前記PAS類似度算出部は、前記参照表現を照応解析部によって取得した前記参照先の表現に置き換えて述語項構造の類似度を算出する請求項1〜請求項3のいずれか1項に記載の整合性判定装置。
  11. 前記文類似度算出部は、以下(1)式に従って、前記一方の文章の文s1と、前記他方の文章の文s2との組み合わせについて、文の類似度を算出する請求項3又は請求項6に記載の整合性判定装置。
    ・・・(1)
    ただし、sentsimは前記文の類似度を返す関数であり、cosは二つのベクトルに対するコサイン類似度を返す関数であり、vecは文をベクトルに変換する関数であり、unmatchは二つの引数が一致しないときに1を返す関数であり、negは文に否定表現が含まれる場合に1を返し、否定表現が含まれない場合に−1を返す関数であり、specは文に推量表現が含まれる場合に1を、推量表現が含まれない場合に−1を返す関数であり、α及びβは予め定められた重みである。
  12. 前記PAS類似度算出部は、以下(2)式に従って、前記一方の文章の文について得られた述語項構造pas1と、前記他方の文章の文について得られた述語項構造pas2との組み合わせについて、述語項構造の類似度を算出する請求項3又は請求項9に記載の整合性判定装置。

    ・・・(2)
    ただし、passimは前記述語項構造の類似度を返す関数であり、rolesは二つの述語項構造間で共通する意味役割の集合を返す関数であり、cosは二つのベクトルに対するコサイン類似度を返す関数であり、wordvecは述語項構造と意味役割を入力とし、前記述語項構造における前記意味役割に対応する単語のベクトルを返す関数であり、unmatchは二つの引数が一致しないときに1を返す関数であり、pasnegは、述語項構造に対応する単語からなる単語列に含まれる否定表現の有無を表し、passpecは、述語項構造に対応する単語からなる単語列に含まれる推量表現の有無を表し、γ及びδは予め定められた重みである。
  13. 入力された二つの文章間の整合性を判定する整合性判定装置における整合性判定方法であって、
    述語項構造解析部が、前記二つの文章に含まれる文の各々について、述語項構造解析を行って述語項構造を得るステップと、
    文類似度算出部が、前記二つの文章のうちの一方の文章の文の各々と、前記二つの文章のうちの他方の文章の文の各々との組み合わせの各々について、文の類似度を算出するステップと、
    PAS類似度算出部が、前記一方の文章の文の各々について得られた述語項構造と、前記他方の文章の文の各々について得られた述語項構造との組み合わせの各々について、述語項構造の類似度を算出するステップと、
    類似度統合部が、前記文類似度算出部によって算出された前記文の類似度と、前記PAS類似度算出部によって算出された前記述語項構造の類似度とを統合し、前記二つの文章間の整合性を判定するステップと、
    を含む整合性判定方法。
  14. 入力された二つの文章間の整合性を判定する整合性判定装置における整合性判定方法であって、
    否定判定部が、前記二つの文章に含まれる文の各々について、否定表現が含まれているか否かを判定するステップと、
    文類似度算出部が、前記二つの文章のうちの一方の文章の文の各々と、前記二つの文章のうちの他方の文章の文の各々との組み合わせの各々について、前記否定判定部による判定結果に基づいて、文の類似度を算出するステップと、
    を含む整合性判定方法。
  15. 入力された二つの文章間の整合性を判定する整合性判定装置における整合性判定方法であって、
    推量判定部が、前記二つの文章に含まれる文の各々について、推量表現が含まれているか否かを判定するステップと、
    文類似度算出部が、前記二つの文章のうちの一方の文章の文の各々と、前記二つの文章のうちの他方の文章の文の各々との組み合わせの各々について、前記推量判定部による判定結果に基づいて、文の類似度を算出するステップと、
    を含む整合性判定方法。
  16. 入力された二つの文章間の整合性を判定する整合性判定装置における整合性判定方法であって、
    述語項構造解析部が、前記二つの文章に含まれる文の各々について、述語項構造解析を行って述語項構造を得るステップと、
    否定判定部が、前記二つの文章に含まれる前記文の各々について、否定表現が含まれているか否かを判定するステップと、
    PAS類似度算出部が、前記二つの文章のうちの一方の文章の文の各々について得られた述語項構造と、前記二つの文章のうちの他方の文章の文の各々について得られた述語項構造との組み合わせの各々について、前記否定判定部による判定結果に基づいて、述語項構造の類似度を算出するステップと、
    を含む整合性判定方法。
  17. 入力された二つの文章間の整合性を判定する整合性判定装置における整合性判定方法であって、
    述語項構造解析部が、前記二つの文章に含まれる文の各々について、述語項構造解析を行って述語項構造を得るステップと、
    推量判定部が、前記二つの文章に含まれる前記文の各々について、推量表現が含まれているか否かを判定するステップと、
    PAS類似度算出部が、前記二つの文章のうちの一方の文章の文の各々について得られた述語項構造と、前記二つの文章のうちの他方の文章の文の各々について得られた述語項構造との組み合わせの各々について、前記推量判定部による判定結果に基づいて、述語項構造の類似度を算出するステップと、
    を含む整合性判定方法。
  18. コンピュータを、請求項1〜請求項12のいずれか1項に記載の整合性判定装置の各部として機能させるためのプログラム。
JP2016167248A 2016-08-29 2016-08-29 整合性判定装置、方法、及びプログラム Active JP6665061B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016167248A JP6665061B2 (ja) 2016-08-29 2016-08-29 整合性判定装置、方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016167248A JP6665061B2 (ja) 2016-08-29 2016-08-29 整合性判定装置、方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2018036725A true JP2018036725A (ja) 2018-03-08
JP6665061B2 JP6665061B2 (ja) 2020-03-13

Family

ID=61566412

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016167248A Active JP6665061B2 (ja) 2016-08-29 2016-08-29 整合性判定装置、方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP6665061B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110163478A (zh) * 2019-04-18 2019-08-23 平安科技(深圳)有限公司 一种合同条款的风险审查方法及装置
CN111414765A (zh) * 2020-03-20 2020-07-14 北京百度网讯科技有限公司 句子一致性的判定方法、装置、电子设备及可读存储介质
CN112749252A (zh) * 2020-07-14 2021-05-04 腾讯科技(深圳)有限公司 一种基于人工智能的文本匹配方法和相关装置
WO2022061833A1 (zh) * 2020-09-27 2022-03-31 西门子股份公司 文本相似度确定方法、装置及工业诊断方法、系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005208782A (ja) * 2004-01-21 2005-08-04 Fuji Xerox Co Ltd 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
WO2013058118A1 (ja) * 2011-10-20 2013-04-25 日本電気株式会社 テキスト含意判定装置、テキスト含意判定方法、及びコンピュータ読み取り可能な記録媒体

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005208782A (ja) * 2004-01-21 2005-08-04 Fuji Xerox Co Ltd 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
WO2013058118A1 (ja) * 2011-10-20 2013-04-25 日本電気株式会社 テキスト含意判定装置、テキスト含意判定方法、及びコンピュータ読み取り可能な記録媒体

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110163478A (zh) * 2019-04-18 2019-08-23 平安科技(深圳)有限公司 一种合同条款的风险审查方法及装置
CN110163478B (zh) * 2019-04-18 2024-04-05 平安科技(深圳)有限公司 一种合同条款的风险审查方法及装置
CN111414765A (zh) * 2020-03-20 2020-07-14 北京百度网讯科技有限公司 句子一致性的判定方法、装置、电子设备及可读存储介质
CN112749252A (zh) * 2020-07-14 2021-05-04 腾讯科技(深圳)有限公司 一种基于人工智能的文本匹配方法和相关装置
CN112749252B (zh) * 2020-07-14 2023-11-03 腾讯科技(深圳)有限公司 一种基于人工智能的文本匹配方法和相关装置
WO2022061833A1 (zh) * 2020-09-27 2022-03-31 西门子股份公司 文本相似度确定方法、装置及工业诊断方法、系统

Also Published As

Publication number Publication date
JP6665061B2 (ja) 2020-03-13

Similar Documents

Publication Publication Date Title
US20160155058A1 (en) Non-factoid question-answering system and method
CN113435186B (zh) 中文文本纠错系统、方法、装置及计算机可读存储介质
Chanlekha et al. Thai named entity extraction by incorporating maximum entropy model with simple heuristic information
Gupta A correction model for real-word errors
JP6665061B2 (ja) 整合性判定装置、方法、及びプログラム
KR101509727B1 (ko) 자율학습 정렬 기반의 정렬 코퍼스 생성 장치 및 그 방법과, 정렬 코퍼스를 사용한 파괴 표현 형태소 분석 장치 및 그 형태소 분석 방법
JP2006244262A (ja) 質問回答検索システム、方法およびプログラム
CN110147546B (zh) 一种英语口语的语法校正方法及装置
JP6145059B2 (ja) モデル学習装置、形態素解析装置、及び方法
US11842152B2 (en) Sentence structure vectorization device, sentence structure vectorization method, and storage medium storing sentence structure vectorization program
Nehar et al. Rational kernels for Arabic root extraction and text classification
US20210073466A1 (en) Semantic vector rule discovery
US20210064820A1 (en) Machine learning lexical discovery
Arikan et al. Detecting clitics related orthographic errors in Turkish
JP2017129995A (ja) 前処理モデル学習装置、方法、及びプログラム
Jayasuriya et al. Learning a stochastic part of speech tagger for sinhala
Mittal et al. Part of speech tagging of Punjabi language using N gram model
Rios et al. Statistical relational learning to recognise textual entailment
US11934779B2 (en) Information processing device, information processing method, and program
Anbananthen et al. Typographic error identification and correction in chatbot using n-gram overlapping approach
Ram et al. Clause boundary identification using conditional random fields
Mathew et al. Paraphrase identification of Malayalam sentences-an experience
Wu et al. Binary-class and Multi-class Chinese Textural Entailment System Description in NTCIR-9 RITE.
Kumar et al. Prediction of Part of Speech Tags for Punjabi using Support Vector Machines.
Irmawati et al. A dependency annotation scheme to extract syntactic features in Indonesian sentences

Legal Events

Date Code Title Description
A80 Written request to apply exceptions to lack of novelty of invention

Free format text: JAPANESE INTERMEDIATE CODE: A80

Effective date: 20160927

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180905

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190807

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190910

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191101

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200128

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200219

R150 Certificate of patent or registration of utility model

Ref document number: 6665061

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150