JP2017027111A - 接続表現項構造解析装置、方法、及びプログラム - Google Patents
接続表現項構造解析装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP2017027111A JP2017027111A JP2015141649A JP2015141649A JP2017027111A JP 2017027111 A JP2017027111 A JP 2017027111A JP 2015141649 A JP2015141649 A JP 2015141649A JP 2015141649 A JP2015141649 A JP 2015141649A JP 2017027111 A JP2017027111 A JP 2017027111A
- Authority
- JP
- Japan
- Prior art keywords
- connection
- sentence
- term
- expression
- connection expression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Machine Translation (AREA)
Abstract
【解決手段】談話構造解析部32が、修辞構造に基づく、談話構造木を生成し、構文解析部34が、構文解析を行って構文木を生成し、接続表現抽出部36が、項を持つ接続表現を抽出し、項位置関係決定部38が、接続表現を含む文内に、接続表現によって結ばれた2つの項が出現するか否かを判定し、文内項抽出部40が、2つの項が出現すると判定された場合、接続表現を含む文から、2つの項を抽出し、文間項抽出部42が、2つの項が出現しないと判定された場合、接続表現を含む文から、項2を抽出し、談話構造木において、接続表現を含む文の親ノード又は兄弟ノードに対応する文から、項1を抽出し、意味クラス分類部44が、接続表現の意味クラスを分類する。
【選択図】図1
Description
野球の試合も中止となった。
(2)辞書エントリ表現の前後5単語とそれらの品詞
(3)構文木における辞書エントリ表現の深さ
(4)構文木における辞書エントリ表現の親、左の兄弟、右の兄弟
(5)構文木における辞書エントリ表現から根までのパス
(2)xの親ノードをxに代入する。この操作をxに代入されたノードがSBARまたはSのラベルをとるまで繰り返し、どちらかのラベルをとった時点でのxによって支配されるテキストスパンを項2とする。
(2)xに代入されたノードがSBARまたはSのラベルをとるまで繰り返し、どちらかのラベルをとった時点でのxによって支配されるテキストスパンを取り出し、そこから項2のスパンを取り除いたものを項1とする。
(2)x、yにそれぞれの親ノードを代入する。
(3)x、yが支配するスパンであるspan(x)及びspan(y)の最左の単語が一致しなくなるまで、(2)を繰り返す。一致しなくなった時点で、yが支配するスパンのうち接続表現直後の単語からスパンの最後の単語までを項2とする。
(2)上記(1)に該当しない場合、yにその親を代入しSBARまたはSのラベルをとるまで構文木を遡る。SBARあるいはSをとった時点でのyが支配するスパンから接続表現と項2を取り除いたスパンを項1とする。
(2)文Si、及び文Sjの最後の単語
(3)文Si、及び文Sjの先頭の3単語
(4)文Siに含まれる単語と文Sjに含まれる単語とのペアすべて
(5)文Siに含まれる単語の意味クラスと文Sjに含まれる単語の意味クラスのペアすべて
(2)文頭、文末における「“”」等の括弧表現を削除する。
20、220 演算部
30 文分割部
32 談話構造解析部
34 構文解析部
36 接続表現抽出部
38 項位置関係決定部
40 文内項抽出部
42、242 文間項抽出部
44、244 意味クラス分類部
46 文間項抽出部
50 出力部
100、200 接続表現項構造解析装置
238 関連文ペア抽出部
Claims (5)
- 入力された文書に基づいて、前記文書に含まれる文の各々の修辞構造に基づく、前記文の各々を各ノードで表わした談話構造木を生成する談話構造解析部と、
前記文書に含まれる文の各々について、構文解析を行って構文木を生成する構文解析部と、
前記構文解析部によって生成された前記文の各々についての構文木に基づいて、項を持つ接続表現を抽出する接続表現抽出部と、
前記接続表現抽出部によって抽出された前記接続表現について、前記接続表現を含む文内に、前記接続表現によって結ばれた2つの項が出現するか否かを判定する項位置関係決定部と、
前記項位置関係決定部によって前記接続表現を含む文内に、前記接続表現によって結ばれた2つの項が出現すると判定された場合、前記接続表現を含む文から、前記接続表現によって結ばれた2つの項を抽出する文内項抽出部と、
前記項位置関係決定部によって前記接続表現を含む文内に、前記接続表現によって結ばれた2つの項が出現しないと判定された場合、前記接続表現を含む文から、前記接続表現によって結ばれた2つの項の何れか一方を抽出し、前記談話構造解析部によって生成された前記談話構造木において、前記接続表現を含む文の親ノード又は兄弟ノードに対応する文から、前記接続表現によって結ばれた2つの項の何れか他方を抽出する文間項抽出部と、
前記接続表現抽出部によって抽出された前記接続表現に基づいて、前記接続表現の意味クラスを分類する意味クラス分類部と、
を含む接続表現項構造解析装置。 - 入力された文書に基づいて、前記文書に含まれる文の各々の修辞構造に基づく、前記文の各々を各ノードで表わした談話構造木を生成する談話構造解析部と、
前記談話構造解析部によって生成された前記談話構造木に基づいて、親子ノードに対応する文のペア、及び兄弟ノードに対応する文のペアを、接続関係を持つ文のペアの候補とし、前記接続関係を持つ文のペアの候補の各々について、接続関係があるか否かを判定する関連文ペア抽出部と、
前記関連文ペア抽出部によって接続関係があると判定された前記接続関係を持つ文のペアの候補の各々について、前記接続関係を持つ文のペアの候補から、暗示的な接続表現によって結ばれる2つの項を抽出する文間項抽出部と、
前記関連文ペア抽出部によって接続関係があると判定された前記接続関係を持つ文のペアの候補の各々について、前記接続関係を持つ文のペアの候補に基づいて、前記暗示的な接続表現の意味クラスを分類する意味クラス分類部と、
を含む接続表現項構造解析装置。 - 談話構造解析部が、入力された文書に基づいて、前記文書に含まれる文の各々の修辞構造に基づく、前記文の各々を各ノードで表わした談話構造木を生成するステップと、
構文解析部が、前記文書に含まれる文の各々について、構文解析を行って構文木を生成するステップと、
接続表現抽出部が、前記構文解析部によって生成された前記文の各々についての構文木に基づいて、項を持つ接続表現を抽出するステップと、
項位置関係決定部が、前記接続表現抽出部によって抽出された前記接続表現について、前記接続表現を含む文内に、前記接続表現によって結ばれた2つの項が出現するか否かを判定するステップと、
文内項抽出部が、前記項位置関係決定部によって前記接続表現を含む文内に、前記接続表現によって結ばれた2つの項が出現すると判定された場合、前記接続表現を含む文から、前記接続表現によって結ばれた2つの項を抽出するステップと、
文間項抽出部が、前記項位置関係決定部によって前記接続表現を含む文内に、前記接続表現によって結ばれた2つの項が出現しないと判定された場合、前記接続表現を含む文から、前記接続表現によって結ばれた2つの項の何れか一方を抽出し、前記談話構造解析部によって生成された前記談話構造木において、前記接続表現を含む文の親ノード又は兄弟ノードに対応する文から、前記接続表現によって結ばれた2つの項の何れか他方を抽出するステップと、
意味クラス分類部が、前記接続表現抽出部によって抽出された前記接続表現に基づいて、前記接続表現の意味クラスを分類するステップと、
を含む接続表現項構造解析方法。 - 談話構造解析部が、入力された文書に基づいて、前記文書に含まれる文の各々の修辞構造に基づく、前記文の各々を各ノードで表わした談話構造木を生成するステップと、
関連文ペア抽出部が、前記談話構造解析部によって生成された前記談話構造木に基づいて、親子ノードに対応する文のペア、及び兄弟ノードに対応する文のペアを、接続関係を持つ文のペアの候補とし、前記接続関係を持つ文のペアの候補の各々について、接続関係があるか否かを判定するステップと、
文間項抽出部が、前記関連文ペア抽出部によって接続関係があると判定された前記接続関係を持つ文のペアの候補の各々について、前記接続関係を持つ文のペアの候補から、暗示的な接続表現によって結ばれる2つの項を抽出するステップと、
意味クラス分類部が、前記関連文ペア抽出部によって接続関係があると判定された前記接続関係を持つ文のペアの候補の各々について、前記接続関係を持つ文のペアの候補に基づいて、前記暗示的な接続表現の意味クラスを分類するステップと、
を含む接続表現項構造解析方法。 - コンピュータを、請求項1又は2に記載の接続表現項構造解析装置を構成する各部として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015141649A JP6499537B2 (ja) | 2015-07-15 | 2015-07-15 | 接続表現項構造解析装置、方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015141649A JP6499537B2 (ja) | 2015-07-15 | 2015-07-15 | 接続表現項構造解析装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017027111A true JP2017027111A (ja) | 2017-02-02 |
JP6499537B2 JP6499537B2 (ja) | 2019-04-10 |
Family
ID=57946570
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015141649A Active JP6499537B2 (ja) | 2015-07-15 | 2015-07-15 | 接続表現項構造解析装置、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6499537B2 (ja) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0322083A (ja) * | 1989-06-20 | 1991-01-30 | Agency Of Ind Science & Technol | 自然言語処理装置 |
JP2001523019A (ja) * | 1997-10-20 | 2001-11-20 | マイクロソフト コーポレイション | テキストの本文の談話構造の自動認識 |
JP2005228075A (ja) * | 2004-02-13 | 2005-08-25 | Institute Of Physical & Chemical Research | 日常言語プログラム処理システム、その方法および修辞構造解析方法 |
JP2005531068A (ja) * | 2002-06-24 | 2005-10-13 | エデュケーショナル テスティング サービス | 自動論文注釈付記システムおよびその方法 |
JP2010271819A (ja) * | 2009-05-20 | 2010-12-02 | Nec Corp | 語句関係抽出装置、語句関係抽出方法及びプログラム |
US20120197631A1 (en) * | 2011-02-01 | 2012-08-02 | Accenture Global Services Limited | System for Identifying Textual Relationships |
-
2015
- 2015-07-15 JP JP2015141649A patent/JP6499537B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0322083A (ja) * | 1989-06-20 | 1991-01-30 | Agency Of Ind Science & Technol | 自然言語処理装置 |
JP2001523019A (ja) * | 1997-10-20 | 2001-11-20 | マイクロソフト コーポレイション | テキストの本文の談話構造の自動認識 |
JP2005531068A (ja) * | 2002-06-24 | 2005-10-13 | エデュケーショナル テスティング サービス | 自動論文注釈付記システムおよびその方法 |
JP2005228075A (ja) * | 2004-02-13 | 2005-08-25 | Institute Of Physical & Chemical Research | 日常言語プログラム処理システム、その方法および修辞構造解析方法 |
JP2010271819A (ja) * | 2009-05-20 | 2010-12-02 | Nec Corp | 語句関係抽出装置、語句関係抽出方法及びプログラム |
US20120197631A1 (en) * | 2011-02-01 | 2012-08-02 | Accenture Global Services Limited | System for Identifying Textual Relationships |
Non-Patent Citations (1)
Title |
---|
梅澤 俊之 外1名: "センタリング理論と対象知識に基づく談話構造解析システムDIA", 自然言語処理, vol. 第18巻第1号, JPN6018028028, 28 January 2011 (2011-01-28), JP, pages 31 - 56, ISSN: 0003842998 * |
Also Published As
Publication number | Publication date |
---|---|
JP6499537B2 (ja) | 2019-04-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7223785B2 (ja) | 時系列ナレッジグラフ生成方法、装置、デバイス及び媒体 | |
KR102431549B1 (ko) | 인과 관계 인식 장치 및 그것을 위한 컴퓨터 프로그램 | |
WO2017038657A1 (ja) | 質問応答システムの訓練装置及びそのためのコンピュータプログラム | |
US20150074112A1 (en) | Multimedia Question Answering System and Method | |
CN111444330A (zh) | 提取短文本关键词的方法、装置、设备及存储介质 | |
KR102491172B1 (ko) | 자연어 질의응답 시스템 및 그 학습 방법 | |
CN110598203A (zh) | 一种结合词典的军事想定文书实体信息抽取方法及装置 | |
CN109933778B (zh) | 分词方法、装置以及计算机可读存储介质 | |
CN109062904B (zh) | 逻辑谓词提取方法和装置 | |
CN111046656A (zh) | 文本处理方法、装置、电子设备及可读存储介质 | |
CN109558482B (zh) | 一种基于Spark框架的文本聚类模型PW-LDA的并行化方法 | |
CN111177375A (zh) | 一种电子文档分类方法及装置 | |
CN113705237A (zh) | 融合关系短语知识的关系抽取方法、装置和电子设备 | |
CN114860942A (zh) | 文本意图分类方法、装置、设备及存储介质 | |
WO2019163642A1 (ja) | 要約評価装置、方法、プログラム、及び記憶媒体 | |
JP7213569B2 (ja) | 画像分類およびマーキング方法、並びに、そのシステム | |
JP6021079B2 (ja) | 文書要約装置、方法、及びプログラム | |
JP6499537B2 (ja) | 接続表現項構造解析装置、方法、及びプログラム | |
Nambiar et al. | Abstractive summarization of Malayalam document using sequence to sequence model | |
CN104298752B (zh) | 基于web网页资源的程序代码缩略词的自动扩充方法 | |
KR102474042B1 (ko) | 데이터 마이닝을 이용한 질병 연관성 분석 방법 | |
CN110069780B (zh) | 一种基于特定领域文本的情感词识别方法 | |
JP6665029B2 (ja) | 言語解析装置、言語解析方法、及びプログラム | |
KR20130113000A (ko) | 언어 처리 장치 및 그 방법 | |
CN113590650A (zh) | 基于特征表达式的结构化查询语句甄别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170822 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180615 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180724 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180925 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190219 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190315 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6499537 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |