JP6667875B2 - 要約文作成モデル学習装置、要約文作成装置、要約文作成モデル学習方法、要約文作成方法、及びプログラム - Google Patents
要約文作成モデル学習装置、要約文作成装置、要約文作成モデル学習方法、要約文作成方法、及びプログラム Download PDFInfo
- Publication number
- JP6667875B2 JP6667875B2 JP2017039546A JP2017039546A JP6667875B2 JP 6667875 B2 JP6667875 B2 JP 6667875B2 JP 2017039546 A JP2017039546 A JP 2017039546A JP 2017039546 A JP2017039546 A JP 2017039546A JP 6667875 B2 JP6667875 B2 JP 6667875B2
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- compressed
- creation
- unit
- oracle
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 38
- 230000006835 compression Effects 0.000 claims description 25
- 238000007906 compression Methods 0.000 claims description 25
- 238000000605 extraction Methods 0.000 claims description 8
- 230000006870 function Effects 0.000 claims description 7
- 238000013528 artificial neural network Methods 0.000 description 8
- 230000014509 gene expression Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 3
- 238000007476 Maximum Likelihood Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 239000000470 constituent Substances 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000013138 pruning Methods 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
(B)入力文中の表現から新たな表現を生成する。
ようにしても良い。
12 モデル作成部
14 デコード部
16 訓練データ作成部
18 要約文作成モデル学習部
20 文圧縮部
Claims (6)
- 1文からなる参考文と前記参考文の正解要約文との組の集合を入力とし、前記参考文について、単語又は文節の係り受け関係を示す係り受け木を作成し、前記係り受け木の部分木のうち、前記参考文と共通して前記正解要約文に含まれる内容語を全て含む最小の係り受け木に基づいて、オラクル圧縮文を抽出し、前記正解要約文と前記オラクル圧縮文との組の集合を作成する訓練データ作成部と、
前記オラクル圧縮文と前記正解要約文との組の集合に基づき、前記オラクル圧縮文から正解要約文を作成するための要約文作成モデルを学習する要約文作成モデル学習部と、
を含む要約文作成モデル学習装置。 - 前記訓練データ作成部は、前記正解要約文と共通して含まれる前記内容語がない前記参考文については、前記オラクル圧縮文の抽出を行わない
請求項1記載の要約文作成モデル学習装置。 - 1文からなる対象文を入力とし、前記対象文を文圧縮する文圧縮部と、
前記文圧縮部により文圧縮された前記対象文、及び、請求項1又は2記載の要約文作成モデル学習装置によって学習された要約文作成モデルに基づいて、前記対象文の要約文を作成するデコード部と、
を含む要約文作成装置。 - 前記文圧縮部は、単一の文圧縮モデル又は複数の文圧縮モデルを用いて複数の圧縮文候補を出力し、
前記デコード部は、前記圧縮文候補のうちの少なくとも1つの前記圧縮文候補、及び前記要約文作成モデルに基づいて、前記対象文の要約文を作成する
請求項3記載の要約文作成装置。 - 訓練データ作成部、及び要約文作成モデル学習部を備えた要約文学習装置における要約文学習方法であって、
前記訓練データ作成部が、1文からなる参考文と前記参考文の正解要約文との組の集合を入力とし、前記参考文について、単語又は文節の係り受け関係を示す係り受け木を作成し、前記係り受け木の部分木のうち、前記参考文と共通して前記正解要約文に含まれる内容語を全て含む最小の係り受け木に基づいて、オラクル圧縮文を抽出し、前記正解要約文と前記オラクル圧縮文との組の集合を作成するステップと、
前記要約文作成モデル学習部が、前記オラクル圧縮文と前記正解要約文との組の集合に基づき、前記オラクル圧縮文から正解要約文を作成するための要約文作成モデルを学習するステップと、
を含む要約文作成モデル学習方法。 - コンピュータを、請求項1又は2記載の要約文作成モデル学習装置の各部、又は請求項3又は4記載の要約文作成装置の各部として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017039546A JP6667875B2 (ja) | 2017-03-02 | 2017-03-02 | 要約文作成モデル学習装置、要約文作成装置、要約文作成モデル学習方法、要約文作成方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017039546A JP6667875B2 (ja) | 2017-03-02 | 2017-03-02 | 要約文作成モデル学習装置、要約文作成装置、要約文作成モデル学習方法、要約文作成方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018147102A JP2018147102A (ja) | 2018-09-20 |
JP6667875B2 true JP6667875B2 (ja) | 2020-03-18 |
Family
ID=63591360
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017039546A Active JP6667875B2 (ja) | 2017-03-02 | 2017-03-02 | 要約文作成モデル学習装置、要約文作成装置、要約文作成モデル学習方法、要約文作成方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6667875B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11556696B2 (en) | 2021-03-15 | 2023-01-17 | Avaya Management L.P. | Systems and methods for processing and displaying messages in digital communications |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9336186B1 (en) * | 2013-10-10 | 2016-05-10 | Google Inc. | Methods and apparatus related to sentence compression |
JP2015090622A (ja) * | 2013-11-06 | 2015-05-11 | 日本電信電話株式会社 | 短縮文生成装置、方法、及びプログラム |
-
2017
- 2017-03-02 JP JP2017039546A patent/JP6667875B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018147102A (ja) | 2018-09-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106776544B (zh) | 人物关系识别方法及装置和分词方法 | |
CN111753531A (zh) | 一种基于人工智能的文本纠错方法、装置、计算机设备及存储介质 | |
Gómez-Adorno et al. | Improving feature representation based on a neural network for author profiling in social media texts | |
EP2950306A1 (en) | A method and system for building a language model | |
CN111563367A (zh) | 基于FocalGAN的短文本自动生成方法、装置、设备及存储介质 | |
CN108133014B (zh) | 基于句法分析和聚类的三元组生成方法、装置及用户终端 | |
CN109815497B (zh) | 基于句法依存的人物属性抽取方法 | |
JP2019191900A (ja) | 言語特徴の抽出装置、固有表現の抽出装置、抽出方法、及びプログラム | |
JP6775465B2 (ja) | 対話ルール照合装置、対話装置、対話ルール照合方法、対話方法、対話ルール照合プログラム、及び対話プログラム | |
JP6667875B2 (ja) | 要約文作成モデル学習装置、要約文作成装置、要約文作成モデル学習方法、要約文作成方法、及びプログラム | |
JP5911931B2 (ja) | 述語項構造抽出装置、方法、プログラム、及びコンピュータ読取り可能な記録媒体 | |
Saloot et al. | Toward tweets normalization using maximum entropy | |
Banga et al. | Tagging efficiency analysis on part of speech taggers | |
JP6564709B2 (ja) | 文書き換え装置、方法、及びプログラム | |
JP2015046183A (ja) | 対話装置、方法、及びプログラム | |
Lee et al. | Syllable-based Malay word stemmer | |
JP2018077604A (ja) | 機能記述からの実現手段・方法の侵害候補を自動特定する人工知能装置 | |
Gurusamy et al. | Stemming techniques for tamil language | |
Jose et al. | Lexical normalization model for noisy SMS text | |
JP5718407B2 (ja) | 対話パターン抽出装置、対話装置、方法、及びプログラム | |
Szabó et al. | Efficiency analysis of inflection rule induction | |
JP2019087058A (ja) | 文章中の省略を特定する人工知能装置 | |
KR20100072841A (ko) | 대용어 복원 방법 | |
Kalpana et al. | Precognition of Content by Interpreting Human Language into Computer Automated Data Processing | |
JP6674411B2 (ja) | 発話生成装置、発話生成方法、及び発話生成プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170307 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181206 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20181206 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20191129 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200121 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200217 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6667875 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |