JP7175474B2 - 文生成学習方法、文生成学習装置及びプログラム - Google Patents
文生成学習方法、文生成学習装置及びプログラム Download PDFInfo
- Publication number
- JP7175474B2 JP7175474B2 JP2019136419A JP2019136419A JP7175474B2 JP 7175474 B2 JP7175474 B2 JP 7175474B2 JP 2019136419 A JP2019136419 A JP 2019136419A JP 2019136419 A JP2019136419 A JP 2019136419A JP 7175474 B2 JP7175474 B2 JP 7175474B2
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- model
- learning
- word
- sentence generation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Machine Translation (AREA)
Description
図4のステップS201の詳細について説明する。図5は、意味的テキスト類似度モデルの学習に関して文生成装置10が有する機能構成例を示す図である。
図4のステップS202の詳細について説明する。文生成モデル学習部12は、意味的テキスト類似度を報酬とする強化学習により文生成モデルを学習する。但し、意味的テキスト類似度は区間[0,5]に分布するので区間[0,1]に正規化するために1/5を掛ける。
11 文生成部
12 文生成モデル学習部
13 意味的テキスト類似度モデル学習部
14 回帰分析部
21 汎用言語モデル学習部
100 ドライブ装置
101 記録媒体
102 補助記憶装置
103 メモリ装置
104 CPU
105 インタフェース装置
121 クロスエントロピー損失計算部
122 意味的テキスト類似度推定部
123 ベースライン報酬推定部
124 強化学習損失計算部
125 文生成モデルパラメタ更新部
126 ベースライン報酬モデル損失計算部
127 ベースライン報酬モデルパラメタ更新部
131 損失計算部
132 意味的テキスト類似度モデルパラメタ更新部
B バス
Claims (5)
- 文生成モデルを用いて、入力文に対する出力文を文頭の単語から一つずつ生成する文生成手順と、
前記単語が生成されるたびに、当該単語と当該単語の位置、及び正解文からクロスエントロピー損失を計算するクロスエントロピー計算手順と、
前記単語が生成されるたびに、前記入力文に対してこれまでに生成された単語列と正解文から、学習済みの意味的テキスト類似度モデルに基づいて意味的テキスト類似度を計算する類似度計算手順と、
前記単語が生成されるたびに、前記文生成モデルのデコーダの内部状態から、学習済みのベースライン報酬モデルに基づいてベースライン報酬を推定する報酬推定手順と、
前記単語が生成されるたびに、前記クロスエントロピー損失と、前記意味的テキスト類似度と、前記ベースライン報酬の推定値とに基づいて、強化学習の損失を計算する強化学習損失計算手順と、
一つの前記出力文の生成が終わると、前記強化学習の損失に応じて前記文生成モデルの学習パラメタを更新する文生成モデルパラメタ更新手順と、
をコンピュータが実行することを特徴とする文生成学習方法。 - 汎用言語モデルBERTを用いて前記意味的テキスト類似度モデルを学習する意味的テキスト類似度モデル学習手順を前記コンピュータが実行する、
ことを特徴とする請求項1記載の文生成学習方法。 - 文生成モデルを用いて、入力文に対する出力文を文頭の単語から一つずつ生成する文生成部と、
前記単語が生成されるたびに、当該単語と当該単語の位置、及び正解文からクロスエントロピー損失を計算するクロスエントロピー計算部と、
前記単語が生成されるたびに、前記入力文に対してこれまでに生成された単語列と正解文から、学習済みの意味的テキスト類似度モデルに基づいて意味的テキスト類似度を計算する類似度計算部と、
前記単語が生成されるたびに、前記文生成モデルのデコーダの内部状態から、学習済みのベースライン報酬モデルに基づいてベースライン報酬を推定する報酬推定部と、
前記単語が生成されるたびに、前記クロスエントロピー損失と、前記意味的テキスト類似度と、前記ベースライン報酬の推定値とに基づいて、強化学習の損失を計算する強化学習損失計算部と、
一つの前記出力文の生成が終わると、前記強化学習の損失に応じて前記文生成モデルの学習パラメタを更新する文生成モデルパラメタ更新部と、
を有することを特徴とする文生成学習装置。 - 汎用言語モデルBERTを用いて前記意味的テキスト類似度モデルを学習する意味的テキスト類似度モデル学習部を有する、
ことを特徴とする請求項3記載の文生成学習装置。 - 請求項1又は2記載の文生成学習方法をコンピュータに実行させることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019136419A JP7175474B2 (ja) | 2019-07-24 | 2019-07-24 | 文生成学習方法、文生成学習装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019136419A JP7175474B2 (ja) | 2019-07-24 | 2019-07-24 | 文生成学習方法、文生成学習装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021022007A JP2021022007A (ja) | 2021-02-18 |
JP7175474B2 true JP7175474B2 (ja) | 2022-11-21 |
Family
ID=74573766
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019136419A Active JP7175474B2 (ja) | 2019-07-24 | 2019-07-24 | 文生成学習方法、文生成学習装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7175474B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220050972A1 (en) * | 2020-08-14 | 2022-02-17 | Iurii Usov | Intelligent discovery multi-turn open dialogue agent |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017129995A (ja) | 2016-01-19 | 2017-07-27 | 日本電信電話株式会社 | 前処理モデル学習装置、方法、及びプログラム |
JP2019510290A (ja) | 2016-01-26 | 2019-04-11 | コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. | ニューラル臨床パラフレーズ生成のためのシステム及び方法 |
-
2019
- 2019-07-24 JP JP2019136419A patent/JP7175474B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017129995A (ja) | 2016-01-19 | 2017-07-27 | 日本電信電話株式会社 | 前処理モデル学習装置、方法、及びプログラム |
JP2019510290A (ja) | 2016-01-26 | 2019-04-11 | コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. | ニューラル臨床パラフレーズ生成のためのシステム及び方法 |
Non-Patent Citations (1)
Title |
---|
Jacob Devlin, Ming-Wei Chang, Kenton Lee, Kristina Toutanova,BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding,arXiv,2019年05月24日,https://arxiv.org/abs/1810.04805 |
Also Published As
Publication number | Publication date |
---|---|
JP2021022007A (ja) | 2021-02-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6444530B2 (ja) | 音声言語理解システム | |
Ramay et al. | Deep neural network-based severity prediction of bug reports | |
US20230040095A1 (en) | Method for pre-training model, device, and storage medium | |
JP7031101B2 (ja) | 方法、システムおよび有形コンピュータ可読デバイス | |
US11170175B1 (en) | Generating replacement sentences for a particular sentiment | |
CN111344779A (zh) | 训练和/或使用编码器模型确定自然语言输入的响应动作 | |
RU2721190C1 (ru) | Обучение нейронных сетей с использованием функций потерь, отражающих зависимости между соседними токенами | |
Romero et al. | Learning hybrid Bayesian networks using mixtures of truncated exponentials | |
CN111414749B (zh) | 基于深度神经网络的社交文本依存句法分析系统 | |
JP7483751B2 (ja) | 教師なしデータ拡張を使用した機械学習モデルのトレーニング | |
CN111401084A (zh) | 一种机器翻译的方法、设备以及计算机可读存储介质 | |
WO2019154411A1 (zh) | 词向量更新方法和装置 | |
US11157707B2 (en) | Natural language response improvement in machine assisted agents | |
JP2016218513A (ja) | ニューラルネットワーク及びそのためのコンピュータプログラム | |
JP7175474B2 (ja) | 文生成学習方法、文生成学習装置及びプログラム | |
CN111241843B (zh) | 基于复合神经网络的语义关系推断系统和方法 | |
JP2017010249A (ja) | パラメタ学習装置、文類似度算出装置、方法、及びプログラム | |
JP6973192B2 (ja) | 言語モデルを利用する装置、方法及びプログラム | |
US20210304056A1 (en) | Learning Parameter Sampling Configuration for Automated Machine Learning | |
CN110287999B (zh) | 基于隐变量模型的故事生成方法及装置 | |
CN112667791A (zh) | 潜在事件预测方法、装置、设备及存储介质 | |
Hwang et al. | End-to-end dialogue system with multi languages for hospital receptionist robot | |
CN115809658A (zh) | 平行语料的生成方法及装置和无监督同义转写方法及装置 | |
US20210365780A1 (en) | Method of generating model and information processing device | |
CN115422324A (zh) | 一种文本处理方法及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7426 Effective date: 20190725 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20190725 |
|
A80 | Written request to apply exceptions to lack of novelty of invention |
Free format text: JAPANESE INTERMEDIATE CODE: A80 Effective date: 20190801 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210818 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220614 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220615 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220803 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221025 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221031 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7175474 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |