JP7054145B2 - 談話構造解析装置、方法、及びプログラム - Google Patents
談話構造解析装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP7054145B2 JP7054145B2 JP2019028629A JP2019028629A JP7054145B2 JP 7054145 B2 JP7054145 B2 JP 7054145B2 JP 2019028629 A JP2019028629 A JP 2019028629A JP 2019028629 A JP2019028629 A JP 2019028629A JP 7054145 B2 JP7054145 B2 JP 7054145B2
- Authority
- JP
- Japan
- Prior art keywords
- spans
- paragraph
- sentence
- tree
- series
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Machine Translation (AREA)
Description
・・・(5)
・・・(6)
最適分割部232は、i番目のEDUからj番目のEDUとして文の先頭のEDUから末尾のEDUを与え、2つのスパンに分割する手続きを再帰的に繰り返し、分割されたスパンが単体のEDUになるまで繰り返す。この手続が終了すると、文に対して非終端記号がNかS、終端記号がEDUとなる2分木が構築される。
20 演算部
30 部分構造解析部
32 文内解析部
34 段落内解析部
36 文書内解析部
38 木結合部
50 出力部
100 談話構造解析装置
220 パラメタ学習部
230 ベクトル変換部
232 最適分割部
234 パラメタ記憶部
236 関係分類部
Claims (5)
- 文書について、前記文書の段落の系列への分割と、各段落に含まれる文の系列への分割と、各文に含まれる基本単位の系列への分割とを行う部分構造解析部と、
各文について、前記文に含まれる前記基本単位の系列の各基本単位を表すEDU(Elementary Discourse Unit)ベクトルと、前記基本単位の系列を二つのスパンに分割する位置、及び前記二つのスパンの各々に付与する非終端記号の組み合わせとを推定するための学習済みのモデルのパラメタとに基づいて、前記文に含まれる前記基本単位の系列を二つのスパンに分割し、かつ、前記二つのスパンの各々に付与する非終端記号の組み合わせを推定すると共に前記基本単位の系列に対する前記二つのスパンの関係ラベルを推定することを、前記スパンの各々が前記基本単位となるまで再帰的に繰り返し、前記スパンの各々をノードとし、非終端記号が付与された二分木で表される、基本単位を単位とした談話構造木である文内談話木を出力する文内解析部と、
各段落について、前記段落に含まれる前記文の系列の各文を表す文ベクトルと、前記文の系列を二つのスパンに分割する位置、及び前記二つのスパンの各々に付与する非終端記号の組み合わせとを推定するための学習済みのモデルのパラメタとに基づいて、前記段落に含まれる前記文の系列を二つのスパンに分割し、かつ、前記二つのスパンの各々に付与する非終端記号の組み合わせを推定すると共に前記文の系列に対する前記二つのスパンの関係ラベルを推定することを、前記スパンの各々が前記文となるまで再帰的に繰り返し、前記スパンの各々をノードとし、非終端記号が付与された二分木で表される、文を単位とした談話構造木である段落内談話木を出力する段落内解析部と、
前記文書に含まれる前記段落の系列の各段落を表す段落ベクトルと、前記段落の系列を二つのスパンに分割する位置、及び前記二つのスパンの各々に付与する非終端記号の組み合わせとを推定するための学習済みのモデルのパラメタとに基づいて、前記文書に含まれる前記段落の系列を二つのスパンに分割し、かつ、前記二つのスパンの各々に付与する非終端記号の組み合わせを推定すると共に前記段落の系列に対する前記二つのスパンの関係ラベルを推定することを、前記スパンの各々が前記段落となるまで再帰的に繰り返し、前記スパンの各々をノードとし、非終端記号が付与された二分木で表される、段落を単位とした談話構造木である文書内談話木を出力する文書内解析部と、
前記文内談話木と、前記段落内談話木と、前記文書内談話木とに基づいて、前記文書の前記基本単位と前記文と前記段落との構造を結合した談話構造木を出力する木結合部と、
を含む談話構造解析装置。 - 前記分割する位置は、前記学習済みのモデルのパラメタに基づいて定義される、前記分割する位置で分割したときに得られる前記二つのスパンのもっともらしさを最大にする位置とする請求項1に記載の談話構造解析装置。
- 部分構造解析部が、文書について、前記文書の段落の系列への分割と、各段落に含まれる文の系列への分割と、各文に含まれる基本単位の系列への分割とを行うステップと、
文内解析部が、各文について、前記文に含まれる前記基本単位の系列の各基本単位を表すEDU(Elementary Discourse Unit)ベクトルと、前記基本単位の系列を二つのスパンに分割する位置、及び前記二つのスパンの各々に付与する非終端記号の組み合わせとを推定するための学習済みのモデルのパラメタとに基づいて、前記文に含まれる前記基本単位の系列を二つのスパンに分割し、かつ、前記二つのスパンの各々に付与する非終端記号の組み合わせを推定することを、前記スパンの各々が前記基本単位となるまで再帰的に繰り返し、前記スパンの各々をノードとし、非終端記号が付与された二分木で表される、基本単位を単位とした談話構造木である文内談話木を出力するステップと、
段落内解析部が、各段落について、前記段落に含まれる前記文の系列の各文を表す文ベクトルと、前記文の系列を二つのスパンに分割する位置、及び前記二つのスパンの各々に付与する非終端記号の組み合わせとを推定するための学習済みのモデルのパラメタとに基づいて、前記段落に含まれる前記文の系列を二つのスパンに分割し、かつ、前記二つのスパンの各々に付与する非終端記号の組み合わせを推定することを、前記スパンの各々が前記文となるまで再帰的に繰り返し、前記スパンの各々をノードとし、非終端記号が付与された二分木で表される、文を単位とした談話構造木である段落内談話木を出力するステップと、
文書内解析部が、前記文書に含まれる前記段落の系列の各段落を表す段落ベクトルと、前記段落の系列を二つのスパンに分割する位置、及び前記二つのスパンの各々に付与する非終端記号の組み合わせとを推定するための学習済みのモデルのパラメタとに基づいて、前記文書に含まれる前記段落の系列を二つのスパンに分割し、かつ、前記二つのスパンの各々に付与する非終端記号の組み合わせを推定することを、前記スパンの各々が前記段落となるまで再帰的に繰り返し、前記スパンの各々をノードとし、非終端記号が付与された二分木で表される、段落を単位とした談話構造木である文書内談話木を出力するステップと、
木結合部が、前記文内談話木と、前記段落内談話木と、前記文書内談話木とに基づいて、前記文書の前記基本単位と前記文と前記段落との構造を結合した談話構造木を出力するステップと、
を含む談話構造解析方法。 - 前記分割する位置は、前記学習済みのモデルのパラメタに基づいて定義される、前記分割する位置で分割したときに得られる前記二つのスパンのもっともらしさを最大にする位置とする請求項3に記載の談話構造解析方法。
- コンピュータを、請求項1又は請求項2に記載の談話構造解析装置の各部として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019028629A JP7054145B2 (ja) | 2019-02-20 | 2019-02-20 | 談話構造解析装置、方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019028629A JP7054145B2 (ja) | 2019-02-20 | 2019-02-20 | 談話構造解析装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020135467A JP2020135467A (ja) | 2020-08-31 |
JP7054145B2 true JP7054145B2 (ja) | 2022-04-13 |
Family
ID=72263252
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019028629A Active JP7054145B2 (ja) | 2019-02-20 | 2019-02-20 | 談話構造解析装置、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7054145B2 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016162198A (ja) | 2015-03-02 | 2016-09-05 | 日本電信電話株式会社 | パラメータ学習方法、装置、及びプログラム |
US20180365228A1 (en) | 2017-06-15 | 2018-12-20 | Oracle International Corporation | Tree kernel learning for text classification into classes of intent |
-
2019
- 2019-02-20 JP JP2019028629A patent/JP7054145B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016162198A (ja) | 2015-03-02 | 2016-09-05 | 日本電信電話株式会社 | パラメータ学習方法、装置、及びプログラム |
US20180365228A1 (en) | 2017-06-15 | 2018-12-20 | Oracle International Corporation | Tree kernel learning for text classification into classes of intent |
Non-Patent Citations (1)
Title |
---|
徳永 健伸,自然言語処理技術の最近の動向,情報処理,社団法人情報処理学会,1992年07月15日,第33巻 第7号,780~789 |
Also Published As
Publication number | Publication date |
---|---|
JP2020135467A (ja) | 2020-08-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109597891B (zh) | 基于双向长短时记忆神经网络的文本情感分析方法 | |
CN106847288B (zh) | 语音识别文本的纠错方法与装置 | |
US8447589B2 (en) | Text paraphrasing method and program, conversion rule computing method and program, and text paraphrasing system | |
US8655803B2 (en) | Method of feature extraction from noisy documents | |
US20140236577A1 (en) | Semantic Representations of Rare Words in a Neural Probabilistic Language Model | |
US10936950B1 (en) | Processing sequential interaction data | |
JP2021022367A (ja) | 画像処理方法及び情報処理装置 | |
Maier et al. | Discontinuous parsing with continuous trees | |
CN111274829A (zh) | 一种利用跨语言信息的序列标注方法 | |
US6850930B2 (en) | Method for transforming words to unique numerical representation | |
CN110751234A (zh) | Ocr识别纠错方法、装置及设备 | |
CN115203507A (zh) | 一种面向文书领域的基于预训练模型的事件抽取方法 | |
JP7054145B2 (ja) | 談話構造解析装置、方法、及びプログラム | |
Leskes | The value of agreement, a new boosting algorithm | |
CN112765985B (zh) | 一种面向特定领域专利实施例的命名实体识别方法 | |
JP6062829B2 (ja) | 係り受け関係解析パラメータ学習装置、係り受け関係解析装置、方法、及びプログラム | |
CN113255353A (zh) | 一种实体标准化方法 | |
CN112016299A (zh) | 计算机执行、利用神经网络生成依存句法树的方法及装置 | |
CN116795789A (zh) | 自动生成专利检索报告的方法及装置 | |
CN113010717B (zh) | 图像诗句描述生成方法、装置和设备 | |
Haghdoost et al. | Building a morphological network for persian on top of a morpheme-segmented lexicon | |
KR102569381B1 (ko) | 테이블 중심의 웹 문서를 위한 기계독해 시스템 및 방법 | |
CN113641789B (zh) | 基于分层融合多头注意力网络和卷积网络的观点检索方法及系统 | |
JP7148077B2 (ja) | 木構造解析装置、方法、及びプログラム | |
CN112214683B (zh) | 基于异构信息网络的混合推荐模型处理方法、系统和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20190221 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210212 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220204 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220301 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220323 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7054145 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |