JP7130233B2 - 要約生成装置、および学習方法 - Google Patents
要約生成装置、および学習方法 Download PDFInfo
- Publication number
- JP7130233B2 JP7130233B2 JP2018147458A JP2018147458A JP7130233B2 JP 7130233 B2 JP7130233 B2 JP 7130233B2 JP 2018147458 A JP2018147458 A JP 2018147458A JP 2018147458 A JP2018147458 A JP 2018147458A JP 7130233 B2 JP7130233 B2 JP 7130233B2
- Authority
- JP
- Japan
- Prior art keywords
- draft
- elaboration
- encoder
- decoder
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
非特許文献1に記載されているようなエンコーダとデコータに基づく自動要約手法では、原文の読み込みと要約の生成はそれぞれ一度行われるため、生成される要約に誤りが多く含まれる。本願の発明者は、以下に示す段階的に要約を生成する方法を考案した。
図1は、第1の実施形態の要約生成装置20の構成を表わす図である。
アテンション層AAは、原文エンコーダAEと、草稿デコーダADの隠れ層の状態とを用いて、アテンションの重みベクトルを計算する。
学習装置10は、草稿生成部ASTSと、草稿改善部CSとを備える。草稿改善部CSは、X段の推敲部BSTS-1~BSTS-Xと、学習データ記憶部13と、学習結果記憶部15とを備える。
図3は、第1の実施形態の要約生成装置20の動作手順を表わすフローチャートである。
草稿エンコーダBE1が、草稿生成部ASTSの草稿デコーダADの出力をエンコードする。
ステップS104において、第x段の推敲部BSTS-xにおいて以下が実行される。
ステップS201~S207において、第1の学習が実行され、ステップS209~S219において、第2の学習が実行される。ここで、第1の学習においては、全学習データセットのうちの半分を用いて実行され、第2の学習においては、全学習データセットを用いて実行する方法が採用されている。例えば、第1の学習において、J個のデータを用い、第2の学習においてK個のデータを用いる方法を利用することもできる。この時、J+Kが全学習データの数となる。
ステップS201において、s=1に設定される。
ステップS210において、学習データ記憶部13に記憶されている第s番目の学習データセットの原文を草稿生成部ASTSへ送られる。
草稿エンコーダBE1が、草稿生成部ASTSの草稿デコーダADの出力をエンコードする。
ステップS214において、第x段の推敲部BSTS-xにおいて以下が実行される。
以下では、草稿改善部CSが1段の推敲部BSTS-1を含むものとして説明する。すなわち、X=1として説明する。
図6は、第3の実施形態の草稿生成部ASTSおよび草稿改善部CSの詳細を表わす図である。草稿改善部CSは、第1段の推敲部BSTS-1を含む。
図7は、第4の実施形態の草稿生成部ASTSおよび草稿改善部CSの詳細を表わす図である。草稿改善部CSは、第1段の推敲部BSTS-1を含む。
図8は、第5の実施形態の草稿生成部ASTSおよび草稿改善部CSの詳細を表わす図である。草稿改善部CSは、第1段の推敲部BSTS-1を含む。
図9は、第6の実施形態の草稿生成部ASTSおよび草稿改善部CSの詳細を表わす図である。草稿改善部CSは、第1段の推敲部BSTS-1を含む。
上述の実施形態に係る学習装置10および要約生成装置20は、コンピュータハードウェアと、そのコンピュータハードウェア上で実行されるコンピュータプログラムとにより実現できる。
図10を参照して、学習装置10および要約生成装置20は、バス1300と、CPU(Central Processing Unit)1301と、ROM(Read Only Memory)1302と、RAM(Random Access Memory)1303と、HDD(Hard Disk Drive)1304と、DVD(Digital Versatile Disk)1307が接続されたDVDドライブ1306と、ネットワークI/F1309と、キーボード1310と、マウス1311と、リムーバブルメモリ1313が接続されるメモリポート1312と、ディスプレイ1308とを備える。
以下に、上記の実施形態の効果について説明する。
本発明は、上記の実施形態に限定されるものではない。本発明は、以下のような変形例も含まれる。
上記の実施形態では、第1の学習と第2の学習の2段階の学習を実行したが、これに限定されるものではない。第2の学習のみを実行するものとしてもよい。
Claims (8)
- 原文が入力される原文エンコーダと、前記原文エンコーダと接続される草稿デコーダとを含む草稿生成部と、
前記草稿生成部と接続され、複数段の推敲部を含む草稿改善部とを備え、
前記推敲部は、草稿エンコーダと、前記草稿エンコーダと接続される推敲デコーダと、アテンション層とを含み、1段目の前記推敲部の前記草稿エンコーダは、前記草稿生成部の前記草稿デコーダの出力を受け、2段目以降の前記推敲部の前記草稿エンコーダは、前段の前記推敲部の前記推敲デコーダの出力を受け、最後段以外の前記推敲部の前記推敲デコーダの出力は、後段の前記推敲部の前記草稿エンコーダの入力と接続され、最後段の前記推敲部の前記推敲デコーダは、要約を出力し、
前記草稿生成部の前記原文エンコーダおよび前記草稿デコーダのパラメータと、前記複数段の前記推敲部の前記草稿エンコーダ、前記推敲デコーダ、および前記アテンション層のパラメータとは、学習によって、前記草稿生成部の前記原文エンコーダに前記原文が入力されて、最後段の前記推敲部の前記推敲デコーダが前記要約を出力するように調整されている、要約生成装置。 - 原文が入力される原文エンコーダと、前記原文エンコーダと接続される草稿デコーダとを含む草稿生成部と、
前記草稿生成部と接続された推敲部とを備え、
前記推敲部は、草稿エンコーダと、前記草稿エンコーダと接続される推敲デコーダと、アテンション層とを含み、前記推敲部の前記草稿エンコーダは、前記草稿生成部の前記草稿デコーダの出力を受け、前記推敲部の前記推敲デコーダは、要約を出力し、
前記草稿生成部の前記原文エンコーダおよび前記草稿デコーダのパラメータと、前記推敲部の前記草稿エンコーダ、前記推敲デコーダ、および前記アテンション層のパラメータとは、学習によって、前記草稿生成部の前記原文エンコーダに前記原文が入力されて、前記推敲部の前記推敲デコーダが前記要約を出力するように調整されている、要約生成装置。 - 前記推敲部の前記アテンション層は、前記草稿生成部の出力である前記原文エンコーダの出力と、前記推敲部の前記草稿エンコーダの出力と、前記推敲部の前記推敲デコーダの隠れ層の状態とを用いて、アテンションの重みベクトルを算出して、前記推敲部の前記推敲デコーダへ出力されてなる、請求項1または2記載の要約生成装置。
- 前記草稿生成部は、さらに、前記原文の単語が前記草稿デコーダの出力に含まれるか否かを表わす一致情報を生成するマッチ部と、前記原文と前記一致情報とが入力される第2の原文エンコーダとを備え、
前記推敲部の前記アテンション層は、前記第2の原文エンコーダの出力と、前記推敲部の前記草稿エンコーダの出力と、前記推敲部の前記推敲デコーダの隠れ層の状態とを用いて、アテンションの重みベクトルを算出して、前記推敲部の前記推敲デコーダへ出力されてなる 、請求項1または2記載の要約生成装置。 - 前記推敲部は、さらに、前記草稿生成部の前記原文エンコーダの隠れ層の最終出力と、前記推敲部の前記草稿エンコーダの出力とに基づいて、前記草稿生成部の前記原文エンコーダの各単語インデックスの隠れ層の状態をフィルタリングして、前記推敲部の前記アテンション層に送るゲートを含む、請求項1~4のいずれか1項に記載の要約生成装置。
- 前記推敲部は、さらに、前記草稿生成部の前記原文エンコーダの隠れ層の最終出力と、前記推敲部の前記草稿エンコーダの出力とに基づいて、前記推敲部の前記推敲デコーダの初期状態を計算する演算部を含む、請求項1~5のいずれか1項に記載の要約生成装置。
- 原文が入力される原文エンコーダと、前記原文エンコーダと接続される草稿デコーダとを含む草稿生成部と、前記草稿生成部と接続され、複数段の推敲部を含む草稿改善部とを備えた要約生成装置のパラメータを学習する学習装置における学習方法であって、前記推敲部は、草稿エンコーダと、前記草稿エンコーダと接続される推敲デコーダと、アテンション層とを含み、1段目の前記推敲部の前記草稿エンコーダは、前記草稿生成部の前記草稿デコーダの出力を受け、2段目以降の前記推敲部の前記草稿エンコーダは、前段の前記推敲部の前記推敲デコーダの出力を受け、最後段以外の前記推敲部の前記推敲デコーダの出力は、後段の前記推敲部の前記草稿エンコーダの入力と接続され、最後段の前記推敲部の前記推敲デコーダは、要約を出力し、
前記学習方法は、
第1の学習において、M個のセットの原文と要約とからなる学習データを用いて、前記草稿生成部の前記原文エンコーダに前記原文が入力されて、前記草稿生成部の前記草稿デコーダが前記要約を出力するように、前記草稿生成部の前記原文エンコーダおよび前記草稿デコーダのパラメータを学習するステップと、
前記学習されたパラメータを第2の学習における前記草稿生成部の前記原文エンコーダおよび前記草稿デコーダのパラメータの初期値に設定するステップと、
前記第2の学習において、N個のセットの原文と要約とからなる学習データを用いて、前記草稿生成部の前記原文エンコーダに前記原文が入力されて、最後段の前記推敲部の前記推敲デコーダが前記要約を出力するように、前記草稿生成部の前記原文エンコーダおよび前記草稿デコーダ、前記複数段の前記推敲部の前記草稿エンコーダ、前記推敲デコーダ、および前記アテンション層のパラメータを学習するステップとを備えた、学習方法。 - 原文が入力される原文エンコーダと、前記原文エンコーダと接続される草稿デコーダとを含む草稿生成部と、前記草稿生成部と接続された推敲部とを備えた要約生成装置のパラメータを学習する学習装置における学習方法であって、前記推敲部は、草稿エンコーダと、前記草稿エンコーダと接続される推敲デコーダと、アテンション層とを含み、前記推敲部の前記草稿エンコーダは、前記草稿生成部の前記草稿デコーダの出力を受け、前記推敲部の前記推敲デコーダは、要約を出力し、
前記学習方法は、
第1の学習において、M個のセットの原文と要約とからなる学習データを用いて、前記草稿生成部の前記原文エンコーダに前記原文が入力されて、前記草稿生成部の前記草稿デコーダが前記要約を出力するように、前記草稿生成部の前記原文エンコーダおよび前記草稿デコーダのパラメータを学習するステップと、
前記学習されたパラメータを第2の学習における前記草稿生成部の前記原文エンコーダおよび前記草稿デコーダのパラメータの初期値に設定するステップと、
前記第2の学習において、N個のセットの原文と要約とからなる学習データを用いて、前記草稿生成部の前記原文エンコーダに前記原文が入力されて、前記推敲部の前記推敲デコーダが前記要約を出力するように、前記草稿生成部の前記原文エンコーダおよび前記草稿デコーダ、前記推敲部の前記草稿エンコーダ、前記推敲デコーダ、および前記アテンション層のパラメータを学習するステップとを備えた、学習方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018147458A JP7130233B2 (ja) | 2018-08-06 | 2018-08-06 | 要約生成装置、および学習方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018147458A JP7130233B2 (ja) | 2018-08-06 | 2018-08-06 | 要約生成装置、および学習方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020024488A JP2020024488A (ja) | 2020-02-13 |
JP7130233B2 true JP7130233B2 (ja) | 2022-09-05 |
Family
ID=69618700
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018147458A Active JP7130233B2 (ja) | 2018-08-06 | 2018-08-06 | 要約生成装置、および学習方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7130233B2 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017111190A (ja) | 2015-12-14 | 2017-06-22 | 株式会社日立製作所 | 対話テキスト要約装置及び方法 |
US20180189274A1 (en) | 2016-12-29 | 2018-07-05 | Ncsoft Corporation | Apparatus and method for generating natural language |
-
2018
- 2018-08-06 JP JP2018147458A patent/JP7130233B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017111190A (ja) | 2015-12-14 | 2017-06-22 | 株式会社日立製作所 | 対話テキスト要約装置及び方法 |
US20180189274A1 (en) | 2016-12-29 | 2018-07-05 | Ncsoft Corporation | Apparatus and method for generating natural language |
Non-Patent Citations (2)
Title |
---|
曹 国林,ニューラル機械翻訳モデルを用いたマルチソース文法誤り訂正,一般社団法人 人工知能学会 第32回全国大会論文集DVD [DVD-ROM] 2018年度 人工知能学会全国大会(第32回),一般社団法人 人工知能学会,2018年06月05日,4Pin1-23 |
梁 燦彬,専門用語の活用による学術論文の生成的要約手法,第10回データ工学と情報マネジメントに関するフォーラム (第16回日本データベース学会年次大会) [Online] ,電子情報通信学会データ工学研究専門委員会 日本データベース学会 情報処理学会データベースシステム研究会,2018年03月06日,DEIM Forum 2018 P9-5,Internet<URL:http://db-event.jpn.org/deim2018/data/papers/165.pdf> |
Also Published As
Publication number | Publication date |
---|---|
JP2020024488A (ja) | 2020-02-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Olmos et al. | A practical guide for using propensity score weighting in R | |
US9922025B2 (en) | Generating distributed word embeddings using structured information | |
Barrón-Cedeno et al. | Convkn at semeval-2016 task 3: Answer and question selection for question answering on arabic and english fora | |
KR101923780B1 (ko) | 일관된 주제의 텍스트 생성 방법 및 이를 수행하는 텍스트 생성 장치 | |
Bostrom et al. | Flexible generation of natural language deductions | |
Schuster et al. | When a sentence does not introduce a discourse entity, transformer-based models still sometimes refer to it | |
Novák | Mining information from time series in the form of sentences of natural language | |
Del Tredici et al. | Question rewriting for open-domain conversational qa: Best practices and limitations | |
CN110795411B (zh) | 一种基于类别门机制的文本分类方法 | |
Burness et al. | Long-distance phonological processes as tier-based strictly local functions | |
Dreyer et al. | Evaluating the tradeoff between abstractiveness and factuality in abstractive summarization | |
JP7130233B2 (ja) | 要約生成装置、および学習方法 | |
Yang et al. | Learning better masking for better language model pre-training | |
Chandlee et al. | Computational universals in linguistic theory: Using recursive programs for phonological analysis | |
Linzen et al. | The timecourse of generalization in phonotactic learning | |
CN112732879A (zh) | 一种问答任务的下游任务处理方法及模型 | |
Bouchard-Côté et al. | Improved reconstruction of protolanguage word forms | |
CN110209962B (zh) | 主题层次高影响力用户的获取方法和系统 | |
EP4323909A1 (en) | Character-level attention neural networks | |
JP2022050973A (ja) | 情報処理装置、及びコンピュータプログラム | |
Thianniwet et al. | Scaling up the fitness function for reverse engineering feature models | |
Glines | Imposing Structure on Generated Sequences: Constrained Hidden Markov Processes | |
Rogers | Causa Nostra: the potentially legitimate business of drawing causal inferences from observational data | |
Kim | Sentence Comprehension with an LSTM Language Model | |
Vincent | Towards personalised and document-level machine translation of dialogue |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210730 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220428 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220517 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220714 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220726 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220817 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7130233 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |