JP6665061B2 - 整合性判定装置、方法、及びプログラム - Google Patents
整合性判定装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP6665061B2 JP6665061B2 JP2016167248A JP2016167248A JP6665061B2 JP 6665061 B2 JP6665061 B2 JP 6665061B2 JP 2016167248 A JP2016167248 A JP 2016167248A JP 2016167248 A JP2016167248 A JP 2016167248A JP 6665061 B2 JP6665061 B2 JP 6665061B2
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- sentences
- similarity
- predicate
- returns
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
ただし、sentsimは前記文の類似度を返す関数であり、cosは二つのベクトルに対するコサイン類似度を返す関数であり、vecは文をベクトルに変換する関数であり、unmatchは二つの引数が一致しないときに1を返す関数であり、negは文に否定表現が含まれる場合に1を返し、否定表現が含まれない場合に−1を返す関数であり、specは文に推量表現が含まれる場合に1を、推量表現が含まれない場合に−1を返す関数であり、α及びβは予め定められた重みである。
・・・(2)
ただし、passimは前記述語項構造の類似度を返す関数であり、rolesは二つの述語項構造間で共通する意味役割の集合を返す関数であり、cosは二つのベクトルに対するコサイン類似度を返す関数であり、wordvecは述語項構造と意味役割を入力とし、前記述語項構造における前記意味役割に対応する単語のベクトルを返す関数であり、unmatchは二つの引数が一致しないときに1を返す関数であり、pasnegは、述語項構造に対応する単語からなる単語列に含まれる否定表現の有無を表し、passpecは、述語項構造に含まれる単語からなる単語列に対応する推量表現の有無を表し、γ及びδは予め定められた重みである。
・・・(2)
20 演算部
30 文分割部
32 照応解析部
34 述語項構造解析部
36 否定判定部
38 推量判定部
40 文類似度算出部
42 PAS類似度算出部
44 類似度統合部
50 出力部
100 整合性判定装置
Claims (10)
- 入力された二つの文章間の整合性を判定する整合性判定装置であって、
前記二つの文章に含まれる文の各々について、述語項構造解析を行って述語項構造を得る述語項構造解析部と、
前記二つの文章に含まれる前記文の各々について、否定表現が含まれているか否かを判定する否定判定部と、
前記二つの文章に含まれる前記文の各々について、推量表現が含まれているか否かを判定する推量判定部と、
前記二つの文章のうちの一方の文章の文の各々と、前記二つの文章のうちの他方の文章の文の各々との組み合わせの各々について、文の類似度を算出する文類似度算出部と、
前記一方の文章の文の各々について得られた述語項構造と、前記他方の文章の文の各々について得られた述語項構造との組み合わせの各々について、述語項構造の類似度を算出するPAS類似度算出部と、
前記文類似度算出部によって算出された前記文の類似度と、前記PAS類似度算出部によって算出された前記述語項構造の類似度とを統合し、前記二つの文章間の整合性を判定する類似度統合部と、を含み、
前記文類似度算出部は、以下(1)式に従って、前記一方の文章の文s1と、前記他方の文章の文s2との組み合わせについて、文の類似度を算出する整合性判定装置。
・・・(1)
ただし、sentsimは前記文の類似度を返す関数であり、cosは二つのベクトルに対するコサイン類似度を返す関数であり、vecは文をベクトルに変換する関数であり、unmatchは二つの引数が一致しないときに1を返す関数であり、negは文に否定表現が含まれる場合に1を返し、否定表現が含まれない場合に−1を返す関数であり、specは文に推量表現が含まれる場合に1を、推量表現が含まれない場合に−1を返す関数であり、α及びβは予め定められた重みである。 - 入力された二つの文章間の整合性を判定する整合性判定装置であって、
前記二つの文章に含まれる文の各々について、述語項構造解析を行って述語項構造を得る述語項構造解析部と、
前記二つの文章に含まれる前記文の各々について、否定表現が含まれているか否かを判定する否定判定部と、
前記二つの文章に含まれる前記文の各々について、推量表現が含まれているか否かを判定する推量判定部と、
前記二つの文章のうちの一方の文章の文の各々と、前記二つの文章のうちの他方の文章の文の各々との組み合わせの各々について、文の類似度を算出する文類似度算出部と、
前記一方の文章の文の各々について得られた述語項構造と、前記他方の文章の文の各々について得られた述語項構造との組み合わせの各々について、述語項構造の類似度を算出するPAS類似度算出部と、
前記文類似度算出部によって算出された前記文の類似度と、前記PAS類似度算出部によって算出された前記述語項構造の類似度とを統合し、前記二つの文章間の整合性を判定する類似度統合部と、を含み、
前記PAS類似度算出部は、以下(2)式に従って、前記一方の文章の文について得られた述語項構造pas1と、前記他方の文章の文について得られた述語項構造pas2との組み合わせについて、述語項構造の類似度を算出する整合性判定装置。
・・・(2)
ただし、passimは前記述語項構造の類似度を返す関数であり、rolesは二つの述語項構造間で共通する意味役割の集合を返す関数であり、cosは二つのベクトルに対するコサイン類似度を返す関数であり、wordvecは述語項構造と意味役割を入力とし、前記述語項構造における前記意味役割に対応する単語のベクトルを返す関数であり、unmatchは二つの引数が一致しないときに1を返す関数であり、pasnegは、述語項構造に対応する単語からなる単語列に含まれる否定表現の有無を表し、passpecは、述語項構造に対応する単語からなる単語列に含まれる推量表現の有無を表し、γ及びδは予め定められた重みである。 - 前記二つの文章の各々に含まれる参照表現が参照する参照先の表現を取得する照応解析部を更に含み、
前記文類似度算出部は、前記参照表現を照応解析部によって取得した前記参照先の表現に置き換えて前記文の類似度の算出を行い、
前記PAS類似度算出部は、前記参照表現を照応解析部によって取得した前記参照先の表現に置き換えて前記述語項構造の類似度の算出を行う請求項1又は請求項2に記載の整合性判定装置。 - 入力された二つの文章間の整合性を判定する整合性判定装置であって、
前記二つの文章に含まれる文の各々について、否定表現が含まれているか否かを判定する否定判定部と、
前記二つの文章に含まれる文の各々について、推量表現が含まれているか否かを判定する推量判定部と、
前記二つの文章のうちの一方の文章の文の各々と、前記二つの文章のうちの他方の文章の文の各々との組み合わせの各々について、前記否定判定部による判定結果と、前記推量判定部による判定結果とに基づいて、文の類似度を算出する文類似度算出部と、を含み、
前記文類似度算出部は、以下(3)式に従って、前記一方の文章の文s1と、前記他方の文章の文s2との組み合わせについて、文の類似度を算出する整合性判定装置。
・・・(3)
ただし、sentsimは前記文の類似度を返す関数であり、cosは二つのベクトルに対するコサイン類似度を返す関数であり、vecは文をベクトルに変換する関数であり、unmatchは二つの引数が一致しないときに1を返す関数であり、negは文に否定表現が含まれる場合に1を返し、否定表現が含まれない場合に−1を返す関数であり、specは文に推量表現が含まれる場合に1を、推量表現が含まれない場合に−1を返す関数であり、α及びβは予め定められた重みである。 - 入力された二つの文章間の整合性を判定する整合性判定装置であって、
前記二つの文章に含まれる文の各々について、述語項構造解析を行って述語項構造を得る述語項構造解析部と、
前記二つの文章に含まれる前記文の各々について、否定表現が含まれているか否かを判定する否定判定部と、
前記二つの文章に含まれる前記文の各々について、推量表現が含まれているか否かを判定する推量判定部と、
前記二つの文章のうちの一方の文章の文の各々について得られた述語項構造と、前記二つの文章のうちの他方の文章の文の各々について得られた述語項構造との組み合わせの各々について、前記否定判定部による判定結果と、前記推量判定部による判定結果とに基づいて、述語項構造の類似度を算出するPAS類似度算出部と、を含み、
前記PAS類似度算出部は、以下(4)式に従って、前記一方の文章の文について得られた述語項構造pas1と、前記他方の文章の文について得られた述語項構造pas2との組み合わせについて、述語項構造の類似度を算出する整合性判定装置。
・・・(4)
ただし、passimは前記述語項構造の類似度を返す関数であり、rolesは二つの述語項構造間で共通する意味役割の集合を返す関数であり、cosは二つのベクトルに対するコサイン類似度を返す関数であり、wordvecは述語項構造と意味役割を入力とし、前記述語項構造における前記意味役割に対応する単語のベクトルを返す関数であり、unmatchは二つの引数が一致しないときに1を返す関数であり、pasnegは、述語項構造に対応する単語からなる単語列に含まれる否定表現の有無を表し、passpecは、述語項構造に対応する単語からなる単語列に含まれる推量表現の有無を表し、γ及びδは予め定められた重みである。 - 入力された二つの文章間の整合性を判定する整合性判定装置における整合性判定方法であって、
述語項構造解析部が、前記二つの文章に含まれる文の各々について、述語項構造解析を行って述語項構造を得るステップと、
否定判定部が、前記二つの文章に含まれる前記文の各々について、否定表現が含まれているか否かを判定するステップと、
推量判定部が、前記二つの文章に含まれる前記文の各々について、推量表現が含まれているか否かを判定するステップと、
文類似度算出部が、前記二つの文章のうちの一方の文章の文の各々と、前記二つの文章のうちの他方の文章の文の各々との組み合わせの各々について、文の類似度を算出するステップと、
PAS類似度算出部が、前記一方の文章の文の各々について得られた述語項構造と、前記他方の文章の文の各々について得られた述語項構造との組み合わせの各々について、述語項構造の類似度を算出するステップと、
類似度統合部が、前記文類似度算出部によって算出された前記文の類似度と、前記PAS類似度算出部によって算出された前記述語項構造の類似度とを統合し、前記二つの文章間の整合性を判定するステップと、を含み、
前記文類似度算出部によるステップは、以下(5)式に従って、前記一方の文章の文s1と、前記他方の文章の文s2との組み合わせについて、文の類似度を算出する整合性判定方法。
・・・(5)
ただし、sentsimは前記文の類似度を返す関数であり、cosは二つのベクトルに対するコサイン類似度を返す関数であり、vecは文をベクトルに変換する関数であり、unmatchは二つの引数が一致しないときに1を返す関数であり、negは文に否定表現が含まれる場合に1を返し、否定表現が含まれない場合に−1を返す関数であり、specは文に推量表現が含まれる場合に1を、推量表現が含まれない場合に−1を返す関数であり、α及びβは予め定められた重みである。 - 入力された二つの文章間の整合性を判定する整合性判定装置における整合性判定方法であって、
述語項構造解析部が、前記二つの文章に含まれる文の各々について、述語項構造解析を行って述語項構造を得るステップと、
否定判定部が、前記二つの文章に含まれる前記文の各々について、否定表現が含まれているか否かを判定するステップと、
推量判定部が、前記二つの文章に含まれる前記文の各々について、推量表現が含まれているか否かを判定するステップと、
文類似度算出部が、前記二つの文章のうちの一方の文章の文の各々と、前記二つの文章のうちの他方の文章の文の各々との組み合わせの各々について、文の類似度を算出するステップと、
PAS類似度算出部が、前記一方の文章の文の各々について得られた述語項構造と、前記他方の文章の文の各々について得られた述語項構造との組み合わせの各々について、述語項構造の類似度を算出するステップと、
類似度統合部が、前記文類似度算出部によって算出された前記文の類似度と、前記PAS類似度算出部によって算出された前記述語項構造の類似度とを統合し、前記二つの文章間の整合性を判定するステップと、を含み、
前記PAS類似度算出部のステップは、以下(6)式に従って、前記一方の文章の文について得られた述語項構造pas1と、前記他方の文章の文について得られた述語項構造pas2との組み合わせについて、述語項構造の類似度を算出する整合性判定方法。
・・・(6)
ただし、passimは前記述語項構造の類似度を返す関数であり、rolesは二つの述語項構造間で共通する意味役割の集合を返す関数であり、cosは二つのベクトルに対するコサイン類似度を返す関数であり、wordvecは述語項構造と意味役割を入力とし、前記述語項構造における前記意味役割に対応する単語のベクトルを返す関数であり、unmatchは二つの引数が一致しないときに1を返す関数であり、pasnegは、述語項構造に対応する単語からなる単語列に含まれる否定表現の有無を表し、passpecは、述語項構造に対応する単語からなる単語列に含まれる推量表現の有無を表し、γ及びδは予め定められた重みである。 - 入力された二つの文章間の整合性を判定する整合性判定装置における整合性判定方法であって、
否定判定部が、前記二つの文章に含まれる文の各々について、否定表現が含まれているか否かを判定するステップと、
推量判定部が、前記二つの文章に含まれる文の各々について、推量表現が含まれているか否かを判定するステップと、
文類似度算出部が、前記二つの文章のうちの一方の文章の文の各々と、前記二つの文章のうちの他方の文章の文の各々との組み合わせの各々について、前記否定判定部による判定結果と、前記推量判定部による判定結果とに基づいて、文の類似度を算出するステップと、を含み、
前記文類似度算出部のステップは、以下(7)式に従って、前記一方の文章の文s1と、前記他方の文章の文s2との組み合わせについて、文の類似度を算出する整合性判定方法。
・・・(7)
ただし、sentsimは前記文の類似度を返す関数であり、cosは二つのベクトルに対するコサイン類似度を返す関数であり、vecは文をベクトルに変換する関数であり、unmatchは二つの引数が一致しないときに1を返す関数であり、negは文に否定表現が含まれる場合に1を返し、否定表現が含まれない場合に−1を返す関数であり、specは文に推量表現が含まれる場合に1を、推量表現が含まれない場合に−1を返す関数であり、α及びβは予め定められた重みである。 - 入力された二つの文章間の整合性を判定する整合性判定装置における整合性判定方法であって、
述語項構造解析部が、前記二つの文章に含まれる文の各々について、述語項構造解析を行って述語項構造を得るステップと、
否定判定部が、前記二つの文章に含まれる前記文の各々について、否定表現が含まれているか否かを判定するステップと、
推量判定部が、前記二つの文章に含まれる前記文の各々について、推量表現が含まれているか否かを判定するステップと、
PAS類似度算出部が、前記二つの文章のうちの一方の文章の文の各々について得られた述語項構造と、前記二つの文章のうちの他方の文章の文の各々について得られた述語項構造との組み合わせの各々について、前記否定判定部による判定結果と、前記推量判定部による判定結果とに基づいて、述語項構造の類似度を算出するステップと、を含み、
前記PAS類似度算出部のステップは、以下(8)式に従って、前記一方の文章の文について得られた述語項構造pas1と、前記他方の文章の文について得られた述語項構造pas2との組み合わせについて、述語項構造の類似度を算出する整合性判定方法。
・・・(8)
ただし、passimは前記述語項構造の類似度を返す関数であり、rolesは二つの述語項構造間で共通する意味役割の集合を返す関数であり、cosは二つのベクトルに対するコサイン類似度を返す関数であり、wordvecは述語項構造と意味役割を入力とし、前記述語項構造における前記意味役割に対応する単語のベクトルを返す関数であり、unmatchは二つの引数が一致しないときに1を返す関数であり、pasnegは、述語項構造に対応する単語からなる単語列に含まれる否定表現の有無を表し、passpecは、述語項構造に対応する単語からなる単語列に含まれる推量表現の有無を表し、γ及びδは予め定められた重みである。 - コンピュータを、請求項1〜請求項5のいずれか1項に記載の整合性判定装置の各部として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016167248A JP6665061B2 (ja) | 2016-08-29 | 2016-08-29 | 整合性判定装置、方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016167248A JP6665061B2 (ja) | 2016-08-29 | 2016-08-29 | 整合性判定装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018036725A JP2018036725A (ja) | 2018-03-08 |
JP6665061B2 true JP6665061B2 (ja) | 2020-03-13 |
Family
ID=61566412
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016167248A Active JP6665061B2 (ja) | 2016-08-29 | 2016-08-29 | 整合性判定装置、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6665061B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110163478B (zh) * | 2019-04-18 | 2024-04-05 | 平安科技(深圳)有限公司 | 一种合同条款的风险审查方法及装置 |
CN111414765B (zh) * | 2020-03-20 | 2023-07-25 | 北京百度网讯科技有限公司 | 句子一致性的判定方法、装置、电子设备及可读存储介质 |
CN112749252B (zh) * | 2020-07-14 | 2023-11-03 | 腾讯科技(深圳)有限公司 | 一种基于人工智能的文本匹配方法和相关装置 |
EP4202714A4 (en) * | 2020-09-27 | 2024-05-22 | Siemens Aktiengesellschaft | METHOD AND DEVICE FOR DETERMINING TEXT SIMILARITY AND INDUSTRIAL DIAGNOSTIC METHOD AND SYSTEM |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005208782A (ja) * | 2004-01-21 | 2005-08-04 | Fuji Xerox Co Ltd | 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム |
SG188994A1 (en) * | 2011-10-20 | 2013-05-31 | Nec Corp | Textual entailment recognition apparatus, textual entailment recognition method, and computer-readable recording medium |
-
2016
- 2016-08-29 JP JP2016167248A patent/JP6665061B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018036725A (ja) | 2018-03-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5389273B1 (ja) | 文脈解析装置および文脈解析方法 | |
US10496928B2 (en) | Non-factoid question-answering system and method | |
US20130204611A1 (en) | Textual entailment recognition apparatus, textual entailment recognition method, and computer-readable recording medium | |
JP2011118526A (ja) | 単語意味関係抽出装置 | |
JP6665061B2 (ja) | 整合性判定装置、方法、及びプログラム | |
Downey et al. | Sparse information extraction: Unsupervised language models to the rescue | |
CN110147546B (zh) | 一种英语口语的语法校正方法及装置 | |
JP2006244262A (ja) | 質問回答検索システム、方法およびプログラム | |
CN112989816A (zh) | 文本内容质量评估方法及系统 | |
Nehar et al. | Rational kernels for Arabic root extraction and text classification | |
JP2005208782A (ja) | 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム | |
Yeh et al. | Chinese spelling check based on N-gram and string matching algorithm | |
Surahio et al. | Prediction system for sindhi parts of speech tags by using support vector machine | |
Jayasuriya et al. | Learning a stochastic part of speech tagger for sinhala | |
Mekala et al. | A survey on authorship attribution approaches | |
Mittal et al. | Part of speech tagging of Punjabi language using N gram model | |
Oudah et al. | Person name recognition using the hybrid approach | |
Rios et al. | Statistical relational learning to recognise textual entailment | |
Sinha et al. | Enhancing the Performance of Part of Speech tagging of Nepali language through Hybrid approach | |
Ram et al. | Clause boundary identification using conditional random fields | |
Chowdhury et al. | Detection of compatibility, proximity and expectancy of Bengali sentences using long short term memory | |
US11934779B2 (en) | Information processing device, information processing method, and program | |
Huang et al. | Modeling human inference process for textual entailment recognition | |
Mathew et al. | Paraphrase identification of Malayalam sentences-an experience | |
Wu et al. | Binary-class and Multi-class Chinese Textural Entailment System Description in NTCIR-9 RITE. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A80 | Written request to apply exceptions to lack of novelty of invention |
Free format text: JAPANESE INTERMEDIATE CODE: A80 Effective date: 20160927 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180905 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190807 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190910 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191101 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200128 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200219 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6665061 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |