JP2018045656A - 学習装置、プログラムパラメータおよび学習方法 - Google Patents
学習装置、プログラムパラメータおよび学習方法 Download PDFInfo
- Publication number
- JP2018045656A JP2018045656A JP2016182361A JP2016182361A JP2018045656A JP 2018045656 A JP2018045656 A JP 2018045656A JP 2016182361 A JP2016182361 A JP 2016182361A JP 2016182361 A JP2016182361 A JP 2016182361A JP 2018045656 A JP2018045656 A JP 2018045656A
- Authority
- JP
- Japan
- Prior art keywords
- word
- sentence
- attribute
- learning
- layer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 47
- 238000000605 extraction Methods 0.000 claims abstract description 13
- 238000013528 artificial neural network Methods 0.000 claims description 3
- 230000000306 recurrent effect Effects 0.000 claims description 3
- 230000008569 process Effects 0.000 description 34
- 230000010365 information processing Effects 0.000 description 24
- 238000003860 storage Methods 0.000 description 19
- 239000000284 extract Substances 0.000 description 14
- 238000010586 diagram Methods 0.000 description 12
- 238000012545 processing Methods 0.000 description 11
- 238000005259 measurement Methods 0.000 description 9
- 238000004458 analytical method Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
〔1−1.学習装置の一例〕
まず、図1を用いて、学習装置が実行する学習処理の一例について説明する。図1は、実施形態に係る学習装置が実行する学習処理の一例を示す図である。図1では、学習装置10は、以下に説明する学習処理を実行する情報処理装置であり、例えば、サーバ装置やクラウドシステム等により実現される。
ここで、情報処理装置100は、利用者の発言に対する応答を出力する。例えば、情報処理装置100は、W2V(word2vec)等の技術を用いて、利用者の発言に含まれる単語群から、異なる分野の単語群であって、利用者の発言に含まれる単語群と同様の概念構造を有する単語群を特定する。このような単語群を文章化して出力した場合には、利用者の発言と概念構造が類似する文章であって、利用者の発言とは異なる分野に属する概念の文章を出力することができるので、利用者のセレンディピティを生じさせることができると考えられる。
ここで、学習装置10は、エンコーダが出力した特徴から、単語群に含まれる各単語と、各単語の属性と、各単語が文章中に出現する順序とを文章中における各単語の属性系列とを復元するデコーダであれば、任意の構成を有するデコーダの学習をおこなってよい。例えば、学習装置10は、エンコーダが出力した特徴から、各単語の属性を復元する属性レイヤと、属性レイヤの出力から、各単語を文章中に出現する順序で復元する単語レイヤとを有するデコーダを学習してもよい。より具体的には、学習装置10は、エンコーダが出力した特徴から各単語の属性を各単語が文章中に出現する順序で復元する属性レイヤと、エンコーダが出力した特徴と属性レイヤが復元した属性とに基づいて、文章中に出現する順序で各単語を復元する単語レイヤとを有するデコーダの学習を行ってもよい。
ここで、学習装置10は、必須ではないものの、単語群に含まれる各単語の特徴と、各単語が文章中に出現する順序とを、各単語の属性と共に符号化するエンコーダの学習を行ってもよい。すなわち、学習装置10は、単語群に含まれる各単語の特徴と、各単語が文章中に出現する順序とを、各単語の属性とともにエンコーダに学習させてもよい。
また、学習装置10は、いわゆるトピックモデル(例えば、非特許文献2を参照)を用いて、単語群から文章の生成を行ってもよい。例えば、学習装置10は、エンコーダが出力した特徴から、所定の文章が示すトピックを復元するトピックレイヤを有するRNNを生成する。そして、学習装置10は、トピックレイヤの出力から、単語群に含まれる各単語と、各単語の属性と、各単語が所定の文章中に出現する順序とを属性系列とともに復元するデコーダを学習してもよい。
なお、学習装置10は、上述した学習処理により学習が行われたRNNを用いて、情報処理装置100から受信した単語群から文章を生成する測定処理を実行する。例えば、学習装置10は、情報処理装置100から単語群を受信すると、受信した単語群を順にRNNのエンコーダに入力し、デコーダが属性系列とともに復元した単語群、すなわち、文章を情報処理装置100へと出力する。
次に、図1を用いて、学習装置10が実行する学習処理および測定処理の一例について説明する。まず、学習装置10は、正解データとなる文章を情報処理装置200から取得する(ステップS1)。なお、正解データとなる文章は、例えば、論文や特許公報、ブログ、マイクロブログ、インターネット上のニュース記事等、任意の文章が採用可能である。
以下、上記した学習処理を実現する学習装置10が有する機能構成の一例について説明する。図2は、実施形態に係る学習装置の構成例を示す図である。図2に示すように、学習装置10は、通信部20、記憶部30、および制御部40を有する。
次に、図6を用いて、学習装置10が実行する処理の流れの一例について説明する。図6は、実施形態に係る処理の流れの一例を説明するフローチャートである。まず、学習装置10は、正解データとなる文章を取得すると(ステップS101)、取得した文章から単語群を抽出する(ステップS102)。そして、学習装置10は、単語群の各単語をエンコーダに入力した際に、デコーダがエンコーダの出力から各単語と、単語の属性と、単語の出現順序とを係り受け、すなわち属性系列とともに復元するように、RNNの学習を行う(ステップS103)。
上記では、学習装置10による学習処理の一例について説明した。しかしながら、実施形態は、これに限定されるものではない。以下、学習装置10が実行する学習処理のバリエーションについて説明する。
上述した例では、学習装置10は、文章のトピックを出力するトピックレイヤL13を有するRNNを生成した。しかしながら、実施形態は、これに限定されるものではない。例えば、学習装置10は、トピックレイヤL13を有しないRNNを生成してもよい。また、学習装置10は、それぞれ異なるトピックモデルに基づいたトピックを出力する複数のトピックレイヤを有するRNNを生成してもよい。
上述した例では、学習装置10は、学習装置10内で学習処理および測定処理を実行した。しかしながら、実施形態は、これに限定されるものではない。例えば、学習装置10は、学習処理のみを実行し、測定処理については、他の装置が実行してもよい。例えば、学習装置10が上述した学習処理によって生成したエンコーダおよびデコーダを有するRNNを含むプログラムパラメータを用いることで、学習装置10以外の情報処理装置が、上述した測定処理を実現してもよい。また、学習装置10は、正解データデータベース31を外部のストレージサーバに記憶させてもよい。
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文章中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
また、上述してきた実施形態に係る学習装置10は、例えば図7に示すような構成のコンピュータ1000によって実現される。図7は、ハードウェア構成の一例を示す図である。コンピュータ1000は、出力装置1010、入力装置1020と接続され、演算装置1030、一次記憶装置1040、二次記憶装置1050、出力IF(Interface)1060、入力IF1070、ネットワークIF1080がバス1090により接続された形態を有する。
上述したように、学習装置10は、所定の文章に含まれる単語群を抽出する。そして、学習装置10は、単語群に含まれる各単語が文章中に出現する順序とともに単語群が有する特徴を学習するエンコーダと、単語群に含まれる各単語と、各単語の属性と、各単語が文章中に出現する順序とを文章中における各単語の属性系列とともに特徴から復元するデコーダとを学習する。このため、学習装置10は、各単語の属性を考慮して、単語群から属性系列を含む文章を生成するRNNを学習することができるので、適切な構造を有する自然な文章を作成することができる。
30 記憶部
31 正解データデータベース
40 制御部
41 抽出部
42 学習部
43 受付部
44 生成部
45 出力部
100、200 情報処理装置
Claims (7)
- 所定の文章に含まれる単語群を抽出する抽出部と、
前記単語群に含まれる各単語が前記文章中に出現する順序とともに当該単語群が有する特徴を学習する符号化器と、前記単語群に含まれる各単語と、当該各単語の属性と、当該各単語が前記文章中に出現する順序とを前記文章中における各単語の属性系列とともに前記特徴から復元する復元器とを学習する学習部と
を有することを特徴とする学習装置。 - 前記学習部は、前記復元器として、前記特徴から前記単語群に含まれる各単語の属性を復元する第1の層と、当該第1の層の出力から前記単語群に含まれる各単語を復元する第2の層とを有する復元器を学習する
ことを特徴とする請求項1に記載の学習装置。 - 前記学習部は、前記特徴から前記単語群に含まれる各単語の属性であって、それぞれ異なる属性を復元する複数の第1の層と、当該複数の第1の層の出力から前記単語群に含まれる各単語を復元する第2の層とを有する復元器を学習する
ことを特徴とする請求項2に記載の学習装置。 - 前記学習部は、前記復元器として、前記特徴から前記所定の文章が示すトピックを復元するトピック復元層の出力から、前記単語群に含まれる各単語と、各単語の属性と、各単語が前記文章中に出現する順序とを前記文章中における各単語の属性系列とともに復元する復元器を学習する
ことを特徴とする請求項1〜3のうちいずれか1つに記載の学習装置。 - 前記学習部は、前記符号化器として、前記単語群に含まれる各単語を入力する第3の層と、各単語の属性を入力する第4の層とを有し、当該第3の層および第4の層の出力から出力する特徴を生成する符号化器を学習する
ことを特徴とする請求項1〜4のうちいずれか1つに記載の学習装置。 - 所定の文章に含まれる単語群を抽出する抽出工程と、
前記単語群に含まれる各単語が前記文章中に出現する順序とともに当該単語群が有する特徴を学習する符号化器と、前記単語群に含まれる各単語と、各単語の属性と、各単語が前記文章中に出現する順序とを前記文章中における各単語の属性系列とともに前記特徴から復元する復元器とを学習する学習工程と
を含むことを特徴とする学習方法で生成される符号化器と復元器とからなるリカレントニューラルネットワークを含むプログラムパラメータ。 - 学習装置が実行する学習方法であって、
所定の文章に含まれる単語群を抽出する抽出工程と、
前記単語群に含まれる各単語が前記文章中に出現する順序とともに当該単語群が有する特徴を学習する符号化器と、前記単語群に含まれる各単語と、当該各単語の属性と、当該各単語が前記文章中に出現する順序とを前記文章中における各単語の属性系列とともに前記特徴から復元する復元器とを学習する学習工程と
を含むことを特徴とする学習方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016182361A JP6680655B2 (ja) | 2016-09-16 | 2016-09-16 | 学習装置および学習方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016182361A JP6680655B2 (ja) | 2016-09-16 | 2016-09-16 | 学習装置および学習方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018045656A true JP2018045656A (ja) | 2018-03-22 |
JP6680655B2 JP6680655B2 (ja) | 2020-04-15 |
Family
ID=61695118
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016182361A Active JP6680655B2 (ja) | 2016-09-16 | 2016-09-16 | 学習装置および学習方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6680655B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019021218A (ja) * | 2017-07-20 | 2019-02-07 | ヤフー株式会社 | 学習装置、プログラムパラメータ、学習方法およびモデル |
JP2020035019A (ja) * | 2018-08-27 | 2020-03-05 | 大日本印刷株式会社 | 情報処理装置、情報処理方法及びプログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05233707A (ja) * | 1992-02-17 | 1993-09-10 | Mitsubishi Electric Corp | 情報データベース装置 |
US20150356401A1 (en) * | 2014-06-06 | 2015-12-10 | Google Inc. | Generating representations of input sequences using neural networks |
-
2016
- 2016-09-16 JP JP2016182361A patent/JP6680655B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05233707A (ja) * | 1992-02-17 | 1993-09-10 | Mitsubishi Electric Corp | 情報データベース装置 |
US20150356401A1 (en) * | 2014-06-06 | 2015-12-10 | Google Inc. | Generating representations of input sequences using neural networks |
Non-Patent Citations (2)
Title |
---|
河東 宗祐 他1名: "発話者を考慮した学習に基づく対話システムの検討", 第8回データ工学と情報マネジメントに関するフォーラム (第14回日本データベース学会年次大会) [O, JPN6019032299, 2 March 2016 (2016-03-02), JP, ISSN: 0004226021 * |
渡辺 有祐 他2名: "直列化された係り受け構造によるニューラルネット文生成", 言語処理学会第22回年次大会 発表論文集 [ONLINE], JPN6019032296, 29 February 2016 (2016-02-29), JP, ISSN: 0004226020 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019021218A (ja) * | 2017-07-20 | 2019-02-07 | ヤフー株式会社 | 学習装置、プログラムパラメータ、学習方法およびモデル |
JP2020035019A (ja) * | 2018-08-27 | 2020-03-05 | 大日本印刷株式会社 | 情報処理装置、情報処理方法及びプログラム |
JP7155758B2 (ja) | 2018-08-27 | 2022-10-19 | 大日本印刷株式会社 | 情報処理装置、情報処理方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP6680655B2 (ja) | 2020-04-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11521110B2 (en) | Learning apparatus, learning method, and non-transitory computer readable storage medium | |
US20190005399A1 (en) | Learning device, generation device, learning method, generation method, and non-transitory computer readable storage medium | |
JP6151404B1 (ja) | 学習装置、学習方法および学習プログラム | |
JP6491262B2 (ja) | モデル | |
JP6975610B2 (ja) | 学習装置および学習方法 | |
JP7058556B2 (ja) | 判定装置、判定方法、および判定プログラム | |
US20190164083A1 (en) | Categorical Data Transformation and Clustering for Machine Learning using Natural Language Processing | |
JP6680655B2 (ja) | 学習装置および学習方法 | |
JP6964481B2 (ja) | 学習装置、プログラムおよび学習方法 | |
JP6775366B2 (ja) | 選択装置、および選択方法 | |
JP6391617B2 (ja) | 学習装置、文章自動生成装置および学習方法 | |
JP6400038B2 (ja) | 抽出装置および抽出方法 | |
JP2019021218A (ja) | 学習装置、プログラムパラメータ、学習方法およびモデル | |
CN112307738A (zh) | 用于处理文本的方法和装置 | |
JP2019057023A (ja) | 生成装置、学習装置、生成方法、学習方法、生成プログラム、学習プログラム、及びモデル | |
JP2018028866A (ja) | 説明文生成方法、説明文生成モデル学習方法、及びプログラム | |
Zhuo | Consumer Demand Behavior Mining and Product Recommendation Based on Online Product Review Mining and Fuzzy Sets | |
JP7017478B2 (ja) | 出力装置、出力方法および出力プログラム | |
JP6526607B2 (ja) | 学習装置、学習方法、および学習プログラム | |
WO2018066083A1 (ja) | 学習プログラム、情報処理装置および学習方法 | |
JP6979899B2 (ja) | 生成装置、学習装置、生成方法、学習方法、生成プログラム、及び学習プログラム | |
JP6963988B2 (ja) | 提供装置、提供方法および提供プログラム | |
Zaikis et al. | DACL: A Domain-Adapted Contrastive Learning Approach to Low Resource Language Representations for Document Clustering Tasks | |
JP7265837B2 (ja) | 学習装置および学習方法 | |
JP7054645B2 (ja) | 生成装置、生成方法、生成プログラムおよびプログラムパラメータ |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190325 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190827 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190823 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191028 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20191101 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20191108 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200310 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200319 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6680655 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |