JP6578941B2 - 含意判定装置、含意判定方法及びプログラム - Google Patents
含意判定装置、含意判定方法及びプログラム Download PDFInfo
- Publication number
- JP6578941B2 JP6578941B2 JP2015503046A JP2015503046A JP6578941B2 JP 6578941 B2 JP6578941 B2 JP 6578941B2 JP 2015503046 A JP2015503046 A JP 2015503046A JP 2015503046 A JP2015503046 A JP 2015503046A JP 6578941 B2 JP6578941 B2 JP 6578941B2
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- sentences
- discourse
- target
- discourse relation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
つまり、非特許文献1、2に開示された技術は、仮説文章に含まれる複数の単文のそれぞれと意味が類似する単文が、対象文章に含まれるか否かを判定することで、含意判定を行う。
単文T11と単文T22とは、類似の関係にある。単文T12と単文T21とは、類似の関係にある。この場合、非特許文献1、2に記載の技術を用いると、対象文章T1は、仮説文章T2を含意すると判定される。しかしながら、仮説文章T2の「Peter went out of (left) the room.」と対象文章T1の「Peter drank a glass of water (something).」とは前後関係が異なるため、実際は、対象文章T1は、仮説文章T2を含意しない。
上記の含意判定装置は、前記第3の単文として、前記第1の単文と意味が類似する単文を、前記対象文章から抽出する抽出部をさらに備えていてもよい。
上記の含意判定装置は、第1の接続語と、前記第1の接続語によって接続される単文間の事象の発生順とを対応付けて記憶する記憶部をさらに備えていてもよい。前記生成部は、前記第1の接続語と前記第3および第4の単文を接続する第2の接続語とが同じであるか判定し、前記第1および第2の接続語が同じであると判定した場合、前記第2の情報における前記第3および第4の単文の順番を前記第1の接続語に対応付けられた事象の発生順に合わせてもよい。
前記算出結果に少なくとも基づいて、前記対象文章が前記仮説文章を含意しているか否かを判定することをコンピュータに実行させる。
本発明の実施態様に係る非一時的記録媒体は、上記のプログラムを記憶する。
以下、図面を参照しながら本発明の実施形態について詳しく説明する。
図1は、本発明の第1の実施形態に係る含意判定装置100の構成を示す概略ブロック図である。
含意判定装置100は、与えられた対象文章と仮説文章とを解析し、対象文章が仮説文章を含意するか否かを判定する装置である。なお、対象文章及び仮説文章は、述部を複数有する複文であっても良いし、単文を含む複数の文からなる文章であっても良い。第1の実施形態に係る含意判定装置100は、文章分割部101、単文距離算出部102、類似文抽出部103、接続語記憶部104、談話関係情報生成部105、談話関係距離算出部106、含意判定部107を備える。
文章分割部101は、単に分割部101と称する場合がある。単文距離算出部102は、単に第1算出部102と称する場合がある。類似文抽出部103は、単に抽出部103と称する場合がある。接続語記憶部104は、単に記憶部104と称する場合がある。談話関係情報生成部105は、単に生成部105と称する場合がある。談話関係距離算出部106は、単に第2算出部106と称する場合がある。含意判定部107は、単に判定部107と称する場合がある。
単文A、B間の接続語が「in other words」など、言い換え関係を示す場合、生成部105は、単文A、Bを同一のインデックスに格納することが好ましい。
図2は、本発明の第1の実施形態に係る含意判定装置100の動作を示すフローチャートである。
含意判定装置100が仮説文章及び対象文章の入力を受け付けると、分割部101は、受け付けた仮説文章及び対象文章を単文に分割する(ステップS1)。次に、第1算出部102は、仮説文章の単文と対象文章の単文の全ての組み合わせについて、単文距離を算出する(ステップS2)。
まず、第2算出部106は、抽出部103が抽出した単文の中から、選択した単文に対応する単文を特定する(ステップS9)。次に、第2算出部106は、対象文章の談話関係情報においてステップS9で特定した単文より後に格納されている単文の中に、仮説文章の談話関係情報においてステップS8で選択した単文より前に格納されている単文に対応する単文が存在するか否かを判定する。つまり、第2算出部106は、ステップS8で選択した単文について、仮説文章と対象文章との間に談話関係が交差する交差箇所があるか否かを判定する(ステップS10)。
第2算出部106は、対象文章T1と仮説文章T2との間に談話関係の交差箇所が無いと判定するため、判定部107は、対象文章T1が仮説文章T2を含意すると判定することができる。
図3は、本発明の第1の実施形態に係る談話関係距離の算出方法の第1の具体例を示す図である。
第1の具体例において対象文章の談話関係情報は、先頭から順に単文A1、A2、A3、A4を格納する。仮説文章の談話関係情報は、先頭から順に単文B1、B2、B3を格納する。単文B1は単文A2に対応している。単文B2は単文A3に対応している。単文B3は単文A1に対応している。
つまり、第1の具体例における談話関係距離は、1である。
第2の具体例において対象文章の談話関係情報は、先頭から順に単文A1、A2、A3、A4を格納する。仮説文章の談話関係情報は、先頭から順に単文B1、B2、B3を格納する。単文B1は単文A2に対応している。単文B2は単文A3に対応している。単文B3は単文A4に対応している。
つまり、第2の具体例における談話関係距離は0であり、対象文章と仮説文章との談話関係が同一であることが分かる。
第3の具体例において対象文章の談話関係情報は、先頭から順に単文A1、A2、A3、A4を格納する。仮説文章の談話関係情報は、先頭から順に単文B1、B2、B3を格納する。単文B1は単文A3に対応している。単文B2は単文A1に対応している。単文B3は単文A2に対応している。
つまり、第3の具体例における談話関係距離は2である。
第4の具体例において対象文章の談話関係情報は、先頭から順に単文A1及びA2、A3、A4を格納する。対象文章では、単文A1と単文A2とが言い換えの関係にある。仮説文章の談話関係情報は、先頭から順に単文B1、B2、B3を格納する。単文B1は単文A2に対応している。単文B2は単文A1に対応している。単文B3は単文A3に対応している。
つまり、第4の具体例における談話関係距離は0であり、対象文章と仮説文章との談話関係が同一であることが分かる。このように、本実施形態に係る含意判定装置100は、言い換え関係にある2つの単文の順序が対象文章と仮説文章の間で入れ替わっている場合にも、適切に含意判定を行うことができる。
次に、本発明の第2の実施形態について詳しく説明する。
第2の実施形態に係る含意判定装置100は、第2算出部106による談話関係距離の算出方法が、第1の実施形態と異なる。
第2の実施形態に係る具体例において対象文章の談話関係情報は、先頭から順に単文A1、A2、A3、A4を格納する。仮説文章の談話関係情報は、先頭から順に単文B1、B2、B3を格納する。単文B1は単文A3に対応している。単文B2は単文A2に対応している。単文B3は単文A1に対応している。単文B1−A3間の単文距離は0.5である。単文B2−A2間の単文距離は0である。単文B3−A1間の単文距離は0.5である。
つまり、本具体例において、談話関係距離は3である。
次に、本発明の第3の実施形態について詳しく説明する。
図8は、本発明の第3の実施形態に係る含意判定装置100の構成を示す概略ブロック図である。
第3の実施形態に係る含意判定装置100は、第1の実施形態の構成に加えてさらに翻訳部108を備える。翻訳部108は、対象文章と仮説文章の言語が異なる場合に、分割部101が分割した各単文を同一の言語に統一する。つまり、翻訳部108は、対象文章から分割した各単文を仮説文章の言語に翻訳するか、仮説文章から分割した各単文を対象文章の言語に翻訳する。第1算出部102は、翻訳された単文間の単文距離を算出する。
例えば、上述した実施形態では、談話関係距離を、交差箇所の数に基づいて算出する場合について説明したが、これに限られない。談話関係が一致しない単文の数に対して単調増加するようなその他の談話関係距離の算出方法を用いても良い。一例として、対象文章の談話関係情報を入れ替えて仮説文章の談話関係情報と同じ順序にするために必要な入れ替え回数を談話関係距離としてもよい。
図9は、本発明の第4の実施形態に係る含意判定装置100の構成を示す概略ブロック図である。
本発明の第4の実施形態に係る含意判定装置100は、抽出部103、生成部105、第2算出部106及び判定部107を備える。
これにより、含意判定装置100は、対象文章の単文と仮説文章の単文との間の談話関係が類似しない場合に、対象文章が仮説文章を含意しないと判定することができる。
上記プログラムは、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
以上、実施形態を参照して本願発明を示し説明したが、本願発明は上記実施形態に限定されない。当業者であれば、請求項によって画定される本願発明の範囲を逸脱しないで、構成や詳細に様々な変更をすることができることが理解されるであろう。
101…文章分割部(分割部)
102…単文距離算出部(第1算出部)
103…類似文抽出部(抽出部)
104…接続語記憶部(記憶部)
105…談話関係情報生成部(生成部)
106…談話関係距離算出部(第2算出部)
107…含意判定部(判定部)
108…翻訳部
Claims (9)
- 仮説文章に含まれる複数の単文ごとに、その単文に意味が類似する単文を、複数の単文を含む対象文章の中から抽出する抽出部と、
前記仮設文章と対象文章のそれぞれについて、ある接続語の前後の単文の出現順序に基づいて単文間の事象の発生順である談話関係を示す談話関係情報を生成する生成部と、
前記談話関係情報に基づいて、前記仮説文章に含まれる単文間の談話関係と、抽出部に抽出された単文間の位置の交差箇所の数である談話関係距離を算出する算出部と、
前記談話関係距離を含む値と所定の閾値とに基づいて、対象文章が仮説文章を含意しているか否かを判定する判定部
とを備える含意判定装置。 - 前記仮説文章を分割することによりそれぞれが述部を1つ有する、第1の単文および第2の単文を含む複数の単文を得て、前記対象文章を分割することによりそれぞれが述部を1つ有する、第3の単文および第4の単文を含む複数の単文を得る分割部
をさらに備え、
前記第1の単文は前記第3の単文に、前記第2の単文は前記第4の単文に類似する
請求項1に記載の含意判定装置。 - 第1の接続語と、前記第1の接続語によって接続される単文間の事象の発生順を示す談話関係とを関連付けて記憶する記憶部をさらに備え、
前記生成部は、前記第1の接続語と前記第1の単文および第2の単文を接続する第2の接続語とが同じであるか判定し、前記第1および第2の接続語が同じであると判定した場合、前記第1の単文および第2の単文の順番を前記第1の接続語に対応付けられた談話関係に基づいて談話関係情報を生成する
請求項1または請求項2に記載の含意判定装置。 - 第1の接続語と、前記第1の接続語によって接続される単文間の事象の発生順を示す談話関係とを関連付けて記憶する記憶部をさらに備え、
前記生成部は、前記第1の接続語と前記第3の単文および第4の単文を接続する第2の接続語とが同じであるか判定し、前記第1および第2の接続語が同じであると判定した場合、前記第3の単文および第4の単文の順番を前記第1の接続語に対応付けられた談話関係に基づいて談話関係情報を生成する
請求項1から請求項3の何れか1項に記載の含意判定装置。 - 前記抽出部は、前記第1の単文と前記第3の単文との意味が類似することを示す第1の単文距離、および前記第2の単文と前記第4の単文との意味が類似することを示す第2の単文距離を特定し、
前記判定部は、少なくとも前記談話関係距離と前記第1および第2の単文距離とで生成される値と閾値とに少なくとも基づいて、前記対象文章が前記仮説文章を含意しているか否かを判定する
請求項2に記載の含意判定装置。
- 前記判定部は、前記談話関係距離と前記第1および第2の単文距離とを用いて算出される値が前記閾値を超えるか否かを判定し、前記閾値を超える場合前記対象文章は前記仮説文章を含意しないと判断し、前記閾値を超えない場合前記対象文章は前記仮説文章を含意すると判断する
請求項5に記載の含意判定装置。 - 前記算出部は、前記第1および第2の単文距離に基づく重みを加えられた値を談話関係距離として算出し、
前記判定部は算出された談話関係距離が閾値を超える場合前記対象文章は前記仮説文章を含意しないと判断し、前記閾値を超えない場合前記対象文章は前記仮説文章を含意すると判断する
請求項5に記載の含意判定装置。 - 仮説文章に含まれる複数の単文ごとに、その単文に意味が類似する単文を、複数の単文を含む対象文章の中から抽出し、
前記仮説文章と対象文章のそれぞれについて、ある接続語の前後の単文の出現順序に基づいて単文間の事象の発生順である談話関係を示す談話関係情報を生成し、
前記談話関係情報に基づいて、前記仮説文章に含まれる単文間の談話関係と、抽出部に抽出された単文間の位置の交差箇所の数である談話関係距離を算出し、
前記談話関係距離を含む値と所定の閾値とに基づいて、対象文章が仮説文章を含意しているか否かを判定する
ことを含む含意判定方法。 - 仮説文章に含まれる複数の単文ごとに、その単文に意味が類似する単文を、複数の単文を含む対象文章の中から抽出し、
前記仮説文章と対象文章のそれぞれについて、ある接続語の前後の単文の出現順序に基づいて単文間の事象の発生順である談話関係を示す談話関係情報を生成し、
前記談話関係情報に基づいて、前記仮説文章に含まれる単文間の談話関係と、抽出部に抽出された単文間の位置の交差箇所の数である談話関係距離を算出し、
前記談話関係距離を含む値と所定の閾値とに基づいて、対象文章が仮説文章を含意しているか否かを判定する
ことをコンピュータに実行させるためのプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013039208 | 2013-02-28 | ||
JP2013039208 | 2013-02-28 | ||
PCT/JP2014/055047 WO2014133127A1 (ja) | 2013-02-28 | 2014-02-28 | 含意判定装置、含意判定方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2014133127A1 JPWO2014133127A1 (ja) | 2017-02-02 |
JP6578941B2 true JP6578941B2 (ja) | 2019-09-25 |
Family
ID=51428385
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015503046A Active JP6578941B2 (ja) | 2013-02-28 | 2014-02-28 | 含意判定装置、含意判定方法及びプログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US9542386B2 (ja) |
JP (1) | JP6578941B2 (ja) |
SG (1) | SG11201506801TA (ja) |
WO (1) | WO2014133127A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021245833A1 (ja) * | 2020-06-03 | 2021-12-09 | 日本電気株式会社 | 文書の黒塗り箇所表示システム、方法、プログラム |
WO2022014016A1 (ja) * | 2020-07-16 | 2022-01-20 | 日本電気株式会社 | 穴埋め試験問題作成システム、方法、プログラム |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017167659A (ja) * | 2016-03-14 | 2017-09-21 | 株式会社東芝 | 機械翻訳装置、方法、およびプログラム |
US20180189266A1 (en) * | 2017-01-03 | 2018-07-05 | Wipro Limited | Method and a system to summarize a conversation |
JP6713136B2 (ja) * | 2017-11-06 | 2020-06-24 | 昭和電工株式会社 | 因果文解析装置、因果文解析システム、プログラム、及び因果文解析方法 |
CN108376178B (zh) * | 2018-03-22 | 2020-08-11 | 北京航空航天大学 | 一种异常访谈记录文本的确定方法及装置 |
JP7312354B2 (ja) * | 2021-05-08 | 2023-07-21 | ソフネック株式会社 | 意図情報抽出プログラム、意図情報抽出装置および意図情報抽出方法 |
US11972212B2 (en) * | 2021-11-10 | 2024-04-30 | Woebot Labs, Inc. | Open input classifier with entailment |
WO2023144872A1 (ja) * | 2022-01-25 | 2023-08-03 | 日本電気株式会社 | 文書分類装置、文書分類方法、および文書分類プログラム |
WO2023157065A1 (ja) * | 2022-02-15 | 2023-08-24 | 日本電信電話株式会社 | 長文分割装置、システム、長文分割方法、及びプログラム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011197863A (ja) * | 2010-03-18 | 2011-10-06 | Konica Minolta Business Technologies Inc | コンテンツ収集装置、コンテンツ収集方法およびコンテンツ収集プログラム |
US8554542B2 (en) * | 2010-05-05 | 2013-10-08 | Xerox Corporation | Textual entailment method for linking text of an abstract to text in the main body of a document |
US9449277B2 (en) * | 2010-10-21 | 2016-09-20 | Nec Corporation | Implication determining device, implication determining method and implication determining program determining if hypothesis is a new fact |
-
2014
- 2014-02-28 SG SG11201506801TA patent/SG11201506801TA/en unknown
- 2014-02-28 WO PCT/JP2014/055047 patent/WO2014133127A1/ja active Application Filing
- 2014-02-28 JP JP2015503046A patent/JP6578941B2/ja active Active
- 2014-02-28 US US14/769,866 patent/US9542386B2/en active Active
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021245833A1 (ja) * | 2020-06-03 | 2021-12-09 | 日本電気株式会社 | 文書の黒塗り箇所表示システム、方法、プログラム |
WO2022014016A1 (ja) * | 2020-07-16 | 2022-01-20 | 日本電気株式会社 | 穴埋め試験問題作成システム、方法、プログラム |
Also Published As
Publication number | Publication date |
---|---|
US9542386B2 (en) | 2017-01-10 |
SG11201506801TA (en) | 2015-09-29 |
US20160012034A1 (en) | 2016-01-14 |
WO2014133127A1 (ja) | 2014-09-04 |
JPWO2014133127A1 (ja) | 2017-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6578941B2 (ja) | 含意判定装置、含意判定方法及びプログラム | |
KR102342066B1 (ko) | 뉴럴 네트워크 모델을 이용한 기계 번역 방법, 장치 및 그 장치를 학습시키기 위한 방법 | |
US9342499B2 (en) | Round-trip translation for automated grammatical error correction | |
CN104573099B (zh) | 题目的搜索方法及装置 | |
US20140163951A1 (en) | Hybrid adaptation of named entity recognition | |
US9600469B2 (en) | Method for detecting grammatical errors, error detection device for same and computer-readable recording medium having method recorded thereon | |
EP2950306A1 (en) | A method and system for building a language model | |
JP6495792B2 (ja) | 音声認識装置、音声認識方法、プログラム | |
JP2019082931A (ja) | 検索装置、類似度算出方法、およびプログラム | |
KR20160133349A (ko) | 구 표 생성 방법 및 구 표를 이용한 기계 번역 방법 | |
US20130138441A1 (en) | Method and system for generating search network for voice recognition | |
US20150178274A1 (en) | Speech translation apparatus and speech translation method | |
US20200234009A1 (en) | Word semantic relation estimation device and word semantic relation estimation method | |
Sharma et al. | End-to-end speech summarization using restricted self-attention | |
Fusayasu et al. | Word-error correction of continuous speech recognition based on normalized relevance distance | |
JP5975938B2 (ja) | 音声認識装置、音声認識方法及びプログラム | |
JP6772394B1 (ja) | 情報学習装置、情報処理装置、情報学習方法、情報処理方法及びプログラム | |
KR20120045906A (ko) | 코퍼스 오류 교정 장치 및 그 방법 | |
CN102945231B (zh) | 一种面向增量式翻译的结构化语言模型构建方法及系统 | |
Khoufi et al. | Chunking Arabic texts using conditional random fields | |
JP2014219809A (ja) | テキストデータ分割装置、テキストデータ分割方法、テキストデータ分割プログラム及び翻訳装置 | |
JP5700833B2 (ja) | 並替モデル生成装置、語順並替装置、方法及びプログラム | |
KR20160085100A (ko) | 하이브리드 번역 장치 및 그 방법 | |
KR101472029B1 (ko) | 색인요소를 이용한 자연어 분석 방법 및 시스템 | |
KR102500106B1 (ko) | 약어 사전 구축 장치 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151110 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170116 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180213 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180411 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180911 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181108 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190507 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190530 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190730 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190812 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6578941 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |