JP2018036725A - 整合性判定装置、方法、及びプログラム - Google Patents
整合性判定装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP2018036725A JP2018036725A JP2016167248A JP2016167248A JP2018036725A JP 2018036725 A JP2018036725 A JP 2018036725A JP 2016167248 A JP2016167248 A JP 2016167248A JP 2016167248 A JP2016167248 A JP 2016167248A JP 2018036725 A JP2018036725 A JP 2018036725A
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- sentences
- similarity
- consistency
- term structure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】文類似度算出部40が、二つの文章のうちの一方の文章の文の各々と、二つの文章のうちの他方の文章の文の各々との組み合わせの各々について、照応解析結果と、否定表現の判定結果と、推量表現の判定結果とに基づいて、文の類似度を算出する。PAS類似度算出部42が、一方の文章の文の各々について得られた述語項構造と、他方の文章の文の各々について得られた述語項構造との組み合わせの各々について、照応解析結果と、否定判定部36の判定結果と、推量判定部38の判定結果とに基づいて、述語項構造の類似度を算出する。類似度統合部44が、算出された文の類似度と、算出された述語項構造の類似度とを統合し、二つの文章間の整合性を判定する。
【選択図】図1
Description
ただし、sentsimは前記文の類似度を返す関数であり、cosは二つのベクトルに対するコサイン類似度を返す関数であり、vecは文をベクトルに変換する関数であり、unmatchは二つの引数が一致しないときに1を返す関数であり、negは文に否定表現が含まれる場合に1を返し、否定表現が含まれない場合に−1を返す関数であり、specは文に推量表現が含まれる場合に1を、推量表現が含まれない場合に−1を返す関数であり、α及びβは予め定められた重みである。
・・・(2)
ただし、passimは前記述語項構造の類似度を返す関数であり、rolesは二つの述語項構造間で共通する意味役割の集合を返す関数であり、cosは二つのベクトルに対するコサイン類似度を返す関数であり、wordvecは述語項構造と意味役割を入力とし、前記述語項構造における前記意味役割に対応する単語のベクトルを返す関数であり、unmatchは二つの引数が一致しないときに1を返す関数であり、pasnegは、述語項構造に対応する単語からなる単語列に含まれる否定表現の有無を表し、passpecは、述語項構造に含まれる単語からなる単語列に対応する推量表現の有無を表し、γ及びδは予め定められた重みである。
・・・(2)
20 演算部
30 文分割部
32 照応解析部
34 述語項構造解析部
36 否定判定部
38 推量判定部
40 文類似度算出部
42 PAS類似度算出部
44 類似度統合部
50 出力部
100 整合性判定装置
Claims (18)
- 入力された二つの文章間の整合性を判定する整合性判定装置であって、
前記二つの文章に含まれる文の各々について、述語項構造解析を行って述語項構造を得る述語項構造解析部と、
前記二つの文章のうちの一方の文章の文の各々と、前記二つの文章のうちの他方の文章の文の各々との組み合わせの各々について、文の類似度を算出する文類似度算出部と、
前記一方の文章の文の各々について得られた述語項構造と、前記他方の文章の文の各々について得られた述語項構造との組み合わせの各々について、述語項構造の類似度を算出するPAS類似度算出部と、
前記文類似度算出部によって算出された前記文の類似度と、前記PAS類似度算出部によって算出された前記述語項構造の類似度とを統合し、前記二つの文章間の整合性を判定する類似度統合部と、
を含む整合性判定装置。 - 前記二つの文章に含まれる前記文の各々について、否定表現が含まれているか否かを判定する否定判定部を更に含み、
前記否定判定部による判定結果に基づいて、前記文類似度算出部による文の類似度、又は前記PAS類似度算出部による述語項構造の類似度の算出が行われる請求項1に記載の整合性判定装置。 - 前記二つの文章に含まれる前記文の各々について、推量表現が含まれているか否かを判定する推量判定部を更に含み、
前記推量判定部による判定結果に基づいて、前記文類似度算出部による文の類似度、又は前記PAS類似度算出部による述語項構造の類似度の算出が行われる請求項1又は請求項2に記載の整合性判定装置。 - 入力された二つの文章間の整合性を判定する整合性判定装置であって、
前記二つの文章に含まれる文の各々について、否定表現が含まれているか否かを判定する否定判定部と、
前記二つの文章のうちの一方の文章の文の各々と、前記二つの文章のうちの他方の文章の文の各々との組み合わせの各々について、前記否定判定部による判定結果に基づいて、文の類似度を算出する文類似度算出部と、
を含む整合性判定装置。 - 入力された二つの文章間の整合性を判定する整合性判定装置であって、
前記二つの文章に含まれる文の各々について、推量表現が含まれているか否かを判定する推量判定部と、
前記二つの文章のうちの一方の文章の文の各々と、前記二つの文章のうちの他方の文章の文の各々との組み合わせの各々について、前記推量判定部による判定結果に基づいて、文の類似度を算出する文類似度算出部と、
を含む整合性判定装置。 - 入力された二つの文章間の整合性を判定する整合性判定装置であって、
前記二つの文章に含まれる文の各々について、否定表現が含まれているか否かを判定する否定判定部と、
前記二つの文章に含まれる文の各々について、推量表現が含まれているか否かを判定する推量判定部と、
前記二つの文章のうちの一方の文章の文の各々と、前記二つの文章のうちの他方の文章の文の各々との組み合わせの各々について、前記否定判定部による判定結果と、前記推量判定部による判定結果とに基づいて、文の類似度を算出する文類似度算出部と、
を含む整合性判定装置。 - 入力された二つの文章間の整合性を判定する整合性判定装置であって、
前記二つの文章に含まれる文の各々について、述語項構造解析を行って述語項構造を得る述語項構造解析部と、
前記二つの文章に含まれる前記文の各々について、否定表現が含まれているか否かを判定する否定判定部と、
前記二つの文章のうちの一方の文章の文の各々について得られた述語項構造と、前記二つの文章のうちの他方の文章の文の各々について得られた述語項構造との組み合わせの各々について、前記否定判定部による判定結果に基づいて、述語項構造の類似度を算出するPAS類似度算出部と、
を含む整合性判定装置。 - 入力された二つの文章間の整合性を判定する整合性判定装置であって、
前記二つの文章に含まれる文の各々について、述語項構造解析を行って述語項構造を得る述語項構造解析部と、
前記二つの文章に含まれる前記文の各々について、推量表現が含まれているか否かを判定する推量判定部と、
前記二つの文章のうちの一方の文章の文の各々について得られた述語項構造と、前記二つの文章のうちの他方の文章の文の各々について得られた述語項構造との組み合わせの各々について、前記推量判定部による判定結果に基づいて、述語項構造の類似度を算出するPAS類似度算出部と、
を含む整合性判定装置。 - 入力された二つの文章間の整合性を判定する整合性判定装置であって、
前記二つの文章に含まれる文の各々について、述語項構造解析を行って述語項構造を得る述語項構造解析部と、
前記二つの文章に含まれる前記文の各々について、否定表現が含まれているか否かを判定する否定判定部と、
前記二つの文章に含まれる前記文の各々について、推量表現が含まれているか否かを判定する推量判定部と、
前記二つの文章のうちの一方の文章の文の各々について得られた述語項構造と、前記二つの文章のうちの他方の文章の文の各々について得られた述語項構造との組み合わせの各々について、前記否定判定部による判定結果と、前記推量判定部による判定結果とに基づいて、述語項構造の類似度を算出するPAS類似度算出部と、
を含む整合性判定装置。 - 前記二つの文章の各々に含まれる参照表現が参照する参照先の表現を取得する照応解析部を更に含み、
前記文類似度算出部は、前記参照表現を照応解析部によって取得した前記参照先の表現に置き換えて文の類似度を算出し、
前記PAS類似度算出部は、前記参照表現を照応解析部によって取得した前記参照先の表現に置き換えて述語項構造の類似度を算出する請求項1〜請求項3のいずれか1項に記載の整合性判定装置。 - 前記文類似度算出部は、以下(1)式に従って、前記一方の文章の文s1と、前記他方の文章の文s2との組み合わせについて、文の類似度を算出する請求項3又は請求項6に記載の整合性判定装置。
ただし、sentsimは前記文の類似度を返す関数であり、cosは二つのベクトルに対するコサイン類似度を返す関数であり、vecは文をベクトルに変換する関数であり、unmatchは二つの引数が一致しないときに1を返す関数であり、negは文に否定表現が含まれる場合に1を返し、否定表現が含まれない場合に−1を返す関数であり、specは文に推量表現が含まれる場合に1を、推量表現が含まれない場合に−1を返す関数であり、α及びβは予め定められた重みである。 - 前記PAS類似度算出部は、以下(2)式に従って、前記一方の文章の文について得られた述語項構造pas1と、前記他方の文章の文について得られた述語項構造pas2との組み合わせについて、述語項構造の類似度を算出する請求項3又は請求項9に記載の整合性判定装置。
・・・(2)
ただし、passimは前記述語項構造の類似度を返す関数であり、rolesは二つの述語項構造間で共通する意味役割の集合を返す関数であり、cosは二つのベクトルに対するコサイン類似度を返す関数であり、wordvecは述語項構造と意味役割を入力とし、前記述語項構造における前記意味役割に対応する単語のベクトルを返す関数であり、unmatchは二つの引数が一致しないときに1を返す関数であり、pasnegは、述語項構造に対応する単語からなる単語列に含まれる否定表現の有無を表し、passpecは、述語項構造に対応する単語からなる単語列に含まれる推量表現の有無を表し、γ及びδは予め定められた重みである。 - 入力された二つの文章間の整合性を判定する整合性判定装置における整合性判定方法であって、
述語項構造解析部が、前記二つの文章に含まれる文の各々について、述語項構造解析を行って述語項構造を得るステップと、
文類似度算出部が、前記二つの文章のうちの一方の文章の文の各々と、前記二つの文章のうちの他方の文章の文の各々との組み合わせの各々について、文の類似度を算出するステップと、
PAS類似度算出部が、前記一方の文章の文の各々について得られた述語項構造と、前記他方の文章の文の各々について得られた述語項構造との組み合わせの各々について、述語項構造の類似度を算出するステップと、
類似度統合部が、前記文類似度算出部によって算出された前記文の類似度と、前記PAS類似度算出部によって算出された前記述語項構造の類似度とを統合し、前記二つの文章間の整合性を判定するステップと、
を含む整合性判定方法。 - 入力された二つの文章間の整合性を判定する整合性判定装置における整合性判定方法であって、
否定判定部が、前記二つの文章に含まれる文の各々について、否定表現が含まれているか否かを判定するステップと、
文類似度算出部が、前記二つの文章のうちの一方の文章の文の各々と、前記二つの文章のうちの他方の文章の文の各々との組み合わせの各々について、前記否定判定部による判定結果に基づいて、文の類似度を算出するステップと、
を含む整合性判定方法。 - 入力された二つの文章間の整合性を判定する整合性判定装置における整合性判定方法であって、
推量判定部が、前記二つの文章に含まれる文の各々について、推量表現が含まれているか否かを判定するステップと、
文類似度算出部が、前記二つの文章のうちの一方の文章の文の各々と、前記二つの文章のうちの他方の文章の文の各々との組み合わせの各々について、前記推量判定部による判定結果に基づいて、文の類似度を算出するステップと、
を含む整合性判定方法。 - 入力された二つの文章間の整合性を判定する整合性判定装置における整合性判定方法であって、
述語項構造解析部が、前記二つの文章に含まれる文の各々について、述語項構造解析を行って述語項構造を得るステップと、
否定判定部が、前記二つの文章に含まれる前記文の各々について、否定表現が含まれているか否かを判定するステップと、
PAS類似度算出部が、前記二つの文章のうちの一方の文章の文の各々について得られた述語項構造と、前記二つの文章のうちの他方の文章の文の各々について得られた述語項構造との組み合わせの各々について、前記否定判定部による判定結果に基づいて、述語項構造の類似度を算出するステップと、
を含む整合性判定方法。 - 入力された二つの文章間の整合性を判定する整合性判定装置における整合性判定方法であって、
述語項構造解析部が、前記二つの文章に含まれる文の各々について、述語項構造解析を行って述語項構造を得るステップと、
推量判定部が、前記二つの文章に含まれる前記文の各々について、推量表現が含まれているか否かを判定するステップと、
PAS類似度算出部が、前記二つの文章のうちの一方の文章の文の各々について得られた述語項構造と、前記二つの文章のうちの他方の文章の文の各々について得られた述語項構造との組み合わせの各々について、前記推量判定部による判定結果に基づいて、述語項構造の類似度を算出するステップと、
を含む整合性判定方法。 - コンピュータを、請求項1〜請求項12のいずれか1項に記載の整合性判定装置の各部として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016167248A JP6665061B2 (ja) | 2016-08-29 | 2016-08-29 | 整合性判定装置、方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016167248A JP6665061B2 (ja) | 2016-08-29 | 2016-08-29 | 整合性判定装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018036725A true JP2018036725A (ja) | 2018-03-08 |
JP6665061B2 JP6665061B2 (ja) | 2020-03-13 |
Family
ID=61566412
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016167248A Active JP6665061B2 (ja) | 2016-08-29 | 2016-08-29 | 整合性判定装置、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6665061B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110163478A (zh) * | 2019-04-18 | 2019-08-23 | 平安科技(深圳)有限公司 | 一种合同条款的风险审查方法及装置 |
CN111414765A (zh) * | 2020-03-20 | 2020-07-14 | 北京百度网讯科技有限公司 | 句子一致性的判定方法、装置、电子设备及可读存储介质 |
CN112749252A (zh) * | 2020-07-14 | 2021-05-04 | 腾讯科技(深圳)有限公司 | 一种基于人工智能的文本匹配方法和相关装置 |
WO2022061833A1 (zh) * | 2020-09-27 | 2022-03-31 | 西门子股份公司 | 文本相似度确定方法、装置及工业诊断方法、系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005208782A (ja) * | 2004-01-21 | 2005-08-04 | Fuji Xerox Co Ltd | 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム |
WO2013058118A1 (ja) * | 2011-10-20 | 2013-04-25 | 日本電気株式会社 | テキスト含意判定装置、テキスト含意判定方法、及びコンピュータ読み取り可能な記録媒体 |
-
2016
- 2016-08-29 JP JP2016167248A patent/JP6665061B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005208782A (ja) * | 2004-01-21 | 2005-08-04 | Fuji Xerox Co Ltd | 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム |
WO2013058118A1 (ja) * | 2011-10-20 | 2013-04-25 | 日本電気株式会社 | テキスト含意判定装置、テキスト含意判定方法、及びコンピュータ読み取り可能な記録媒体 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110163478A (zh) * | 2019-04-18 | 2019-08-23 | 平安科技(深圳)有限公司 | 一种合同条款的风险审查方法及装置 |
CN110163478B (zh) * | 2019-04-18 | 2024-04-05 | 平安科技(深圳)有限公司 | 一种合同条款的风险审查方法及装置 |
CN111414765A (zh) * | 2020-03-20 | 2020-07-14 | 北京百度网讯科技有限公司 | 句子一致性的判定方法、装置、电子设备及可读存储介质 |
CN112749252A (zh) * | 2020-07-14 | 2021-05-04 | 腾讯科技(深圳)有限公司 | 一种基于人工智能的文本匹配方法和相关装置 |
CN112749252B (zh) * | 2020-07-14 | 2023-11-03 | 腾讯科技(深圳)有限公司 | 一种基于人工智能的文本匹配方法和相关装置 |
WO2022061833A1 (zh) * | 2020-09-27 | 2022-03-31 | 西门子股份公司 | 文本相似度确定方法、装置及工业诊断方法、系统 |
Also Published As
Publication number | Publication date |
---|---|
JP6665061B2 (ja) | 2020-03-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20160155058A1 (en) | Non-factoid question-answering system and method | |
CN113435186B (zh) | 中文文本纠错系统、方法、装置及计算机可读存储介质 | |
Chanlekha et al. | Thai named entity extraction by incorporating maximum entropy model with simple heuristic information | |
Gupta | A correction model for real-word errors | |
JP6665061B2 (ja) | 整合性判定装置、方法、及びプログラム | |
KR101509727B1 (ko) | 자율학습 정렬 기반의 정렬 코퍼스 생성 장치 및 그 방법과, 정렬 코퍼스를 사용한 파괴 표현 형태소 분석 장치 및 그 형태소 분석 방법 | |
JP2006244262A (ja) | 質問回答検索システム、方法およびプログラム | |
CN110147546B (zh) | 一种英语口语的语法校正方法及装置 | |
JP6145059B2 (ja) | モデル学習装置、形態素解析装置、及び方法 | |
US11842152B2 (en) | Sentence structure vectorization device, sentence structure vectorization method, and storage medium storing sentence structure vectorization program | |
Nehar et al. | Rational kernels for Arabic root extraction and text classification | |
US20210073466A1 (en) | Semantic vector rule discovery | |
US20210064820A1 (en) | Machine learning lexical discovery | |
Arikan et al. | Detecting clitics related orthographic errors in Turkish | |
JP2017129995A (ja) | 前処理モデル学習装置、方法、及びプログラム | |
Jayasuriya et al. | Learning a stochastic part of speech tagger for sinhala | |
Mittal et al. | Part of speech tagging of Punjabi language using N gram model | |
Rios et al. | Statistical relational learning to recognise textual entailment | |
US11934779B2 (en) | Information processing device, information processing method, and program | |
Anbananthen et al. | Typographic error identification and correction in chatbot using n-gram overlapping approach | |
Ram et al. | Clause boundary identification using conditional random fields | |
Mathew et al. | Paraphrase identification of Malayalam sentences-an experience | |
Wu et al. | Binary-class and Multi-class Chinese Textural Entailment System Description in NTCIR-9 RITE. | |
Kumar et al. | Prediction of Part of Speech Tags for Punjabi using Support Vector Machines. | |
Irmawati et al. | A dependency annotation scheme to extract syntactic features in Indonesian sentences |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A80 | Written request to apply exceptions to lack of novelty of invention |
Free format text: JAPANESE INTERMEDIATE CODE: A80 Effective date: 20160927 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180905 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190807 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190910 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191101 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200128 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200219 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6665061 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |