JP2019021218A - 学習装置、プログラムパラメータ、学習方法およびモデル - Google Patents
学習装置、プログラムパラメータ、学習方法およびモデル Download PDFInfo
- Publication number
- JP2019021218A JP2019021218A JP2017141314A JP2017141314A JP2019021218A JP 2019021218 A JP2019021218 A JP 2019021218A JP 2017141314 A JP2017141314 A JP 2017141314A JP 2017141314 A JP2017141314 A JP 2017141314A JP 2019021218 A JP2019021218 A JP 2019021218A
- Authority
- JP
- Japan
- Prior art keywords
- word
- sentence
- attribute
- learning
- layer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
〔1−1.学習装置の一例〕
まず、図1を用いて、学習装置が実行する学習処理の一例について説明する。図1は、実施形態に係る学習装置が実行する学習処理の一例を示す図である。図1では、学習装置10は、以下に説明する学習処理を実行する情報処理装置であり、例えば、サーバ装置やクラウドシステム等により実現される。
ここで、情報処理装置100は、入力された文章に対応する応答を出力する。例えば、情報処理装置100は、w2v(word2vec)やs2v(sentence2vec)等、単語や文章をベクトル(多次元量)に変換し、変換後のベクトルを用いて入力された文章に対応する応答を出力する。より具体的な例を挙げると、情報処理装置100は、利用者の発言に含まれる単語群から、異なる分野の単語群であって、利用者の発言に含まれる単語群と同様の概念構造を有する単語群を特定する。このような単語群を文章化して出力した場合には、利用者の発言と概念構造が類似する文章であって、利用者の発言とは異なる分野に属する概念の文章を出力することができるので、利用者のセレンディピティを生じさせることができると考えられる。
ここで、学習装置10は、エンコーダが出力した特徴から、各単語の重要度に基づいて、単語群に含まれる各単語と各単語が文章中に出現する順序とを文章中における各単語の属性系列とともに特徴から復元するデコーダであれば、任意の構成を有するデコーダの学習をおこなってよい。例えば、学習装置10は、エンコーダが出力した特徴から、各単語の属性を復元する属性レイヤと、属性レイヤの出力から、各単語を文章中に出現する順序で復元する単語レイヤとを有するデコーダを学習する。より具体的には、学習装置10は、エンコーダが出力した特徴から各単語の属性を各単語が文章中に出現する順序で復元する属性レイヤと、エンコーダが出力した特徴と属性レイヤが復元した属性とに基づいて、文章中に出現する順序で各単語を復元する単語レイヤとを有するデコーダを学習する。
ここで、学習装置10は、必須ではないものの、単語群に含まれる各単語の特徴と、各単語が文章中に出現する順序とを、各単語の属性とともに符号化するエンコーダの学習を行ってもよい。すなわち、学習装置10は、単語群に含まれる各単語の特徴と、各単語が文章中に出現する順序とを、各単語の属性とともにエンコーダに学習させてもよい。
また、学習装置10は、いわゆるトピックモデル(例えば、非特許文献2を参照)を用いて、単語群から文章の生成を行ってもよい。例えば、学習装置10は、エンコーダが出力した特徴から、所定の文章が示すトピックを復元するトピックレイヤを有するモデルを生成する。そして、学習装置10は、トピックレイヤの出力から、単語群に含まれる各単語と、各単語の属性と、各単語が所定の文章中に出現する順序とを属性系列とともに復元するデコーダを学習してもよい。
なお、学習装置10は、上述した学習処理により学習が行われたモデルを用いて、情報処理装置100から受信した単語群から文章を生成する測定処理を実行する。例えば、学習装置10は、情報処理装置100から単語群を受信すると、受信した単語群を順にモデルのエンコーダに入力し、デコーダが属性系列とともに復元した単語群、すなわち、文章を情報処理装置100へと出力する。
次に、図1を用いて、学習装置10が実行する学習処理および測定処理の一例について説明する。まず、学習装置10は、正解データとなる文章を情報処理装置200から取得する(ステップS1)。なお、正解データとなる文章は、例えば、論文や特許公報、ブログ、マイクロブログ、インターネット上のニュース記事等、任意の文章が採用可能である。
以下、上記した学習処理を実現する学習装置10が有する機能構成の一例について説明する。図2は、実施形態に係る学習装置の構成例を示す図である。図2に示すように、学習装置10は、通信部20、記憶部30、および制御部40を有する。
次に、図8を用いて、学習装置10が実行する処理の流れの一例について説明する。図8は、実施形態に係る処理の流れの一例を説明するフローチャートである。まず、学習装置10は、正解データとなる文章を取得すると(ステップS101)、取得した文章から単語群を抽出する(ステップS102)。そして、学習装置10は、単語群の各単語を出現順にエンコーダに入力した際にエンコーダが出力した情報から、単語の属性と出現順序とに基づく重要度に基づいて、単語と、単語の属性と、単語の出現順序とを係り受けとともに復元するデコーダの学習を行う(ステップS103)。
上記では、学習装置10による学習処理の一例について説明した。しかしながら、実施形態は、これに限定されるものではない。以下、学習装置10が実行する学習処理のバリエーションについて説明する。
上述した例では、学習装置10は、文章のトピックを出力するトピックレイヤL13を有するモデルを生成した。しかしながら、実施形態は、これに限定されるものではない。例えば、学習装置10は、トピックレイヤL13を有しないモデルを生成してもよい。また、学習装置10は、それぞれ異なるトピックモデルに基づいたトピックを出力する複数のトピックレイヤを有するモデルを生成してもよい。
また、学習装置10は、全体で一つのDPCNにより構成されるデコーダL12を有するモデルL10の学習を行ってもよい。また、学習装置10は、状態レイヤL14、属性レイヤL15、単語レイヤL16がそれぞれDPCNにより構成されるデコーダL12を有するモデルL10の学習を行ってもよい。また、学習装置10は、DPCNにより構成されるエンコーダL11の学習を行ってもよい。
上述した例では、学習装置10は、学習装置10内で学習処理および測定処理を実行した。しかしながら、実施形態は、これに限定されるものではない。例えば、学習装置10は、学習処理のみを実行し、測定処理については、他の装置が実行してもよい。例えば、学習装置10が上述した学習処理によって生成したエンコーダおよびデコーダを有するモデルL10を含むプログラムパラメータを用いることで、学習装置10以外の情報処理装置が、上述した測定処理を実現してもよい。また、学習装置10は、正解データデータベース31を外部のストレージサーバに記憶させてもよい。
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文章中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
また、上述してきた実施形態に係る学習装置10は、例えば図9に示すような構成のコンピュータ1000によって実現される。図9は、ハードウェア構成の一例を示す図である。コンピュータ1000は、出力装置1010、入力装置1020と接続され、演算装置1030、一次記憶装置1040、二次記憶装置1050、出力IF(Interface)1060、入力IF1070、ネットワークIF1080がバス1090により接続された形態を有する。
上述したように、学習装置10は、所定の文章に含まれる単語群を抽出する。また、学習装置10は、抽出した単語群に含まれる各単語が文章中に出現する順序とともに、各単語が影響を受ける文法構造を重みとして学習するための符号化器の学習を行う。また、学習装置10は、単語群に含まれる各単語と、各単語の属性と、各単語が文章中に出現する順序とを文章中における各単語の属性系列とともに符号化器が出力する特徴から復元する復元器を学習する。
30 記憶部
31 正解データデータベース
32 モデルデータベース
40 制御部
41 抽出部
42 学習部
43 受付部
44 生成部
45 出力部
100、200 情報処理装置
Claims (9)
- 所定の文章に含まれる単語群を抽出する抽出部と、
前記単語群に含まれる各単語が前記文章中に出現する順序とともに、各単語が影響を受ける文法構造を重みとして学習するための符号化器と、前記単語群に含まれる各単語と、当該各単語の属性と、当該各単語が前記文章中に出現する順序とを前記文章中における各単語の属性系列とともに前記特徴から復元する復元器とを学習する学習部と
を有することを特徴とする学習装置。 - 前記学習部は、前記単語群に含まれる各単語が前記文章中に出現する順序とともに当該単語群が有する特徴を学習する符号化器、および、前記単語群に含まれる各単語の属性と当該各単語が前記文章中に出現する順序とに基づく各単語の前記所定の文章における重要度に基づいて、前記単語群に含まれる各単語と当該各単語が前記文章中に出現する順序とを前記文章中における各単語の属性系列とともに前記特徴から復元する復元器とを学習する
ことを特徴とする請求項1に記載の学習装置。 - 前記学習部は、前記復元器として、前記特徴から前記単語群に含まれる各単語の属性を復元する第1の層であって、入力された情報と、前回出力した情報とに基づいて新たに出力する情報を生成する第1の層と、当該第1の層の出力から前記単語群に含まれる各単語を復元する第2の層とを有する復元器を学習する
ことを特徴とする請求項1または2に記載の学習装置。 - 前記学習部は、前記第1の層として、入力された情報と、前回出力した情報とに基づいて新たに出力する情報を生成する第1の層との畳み込みに基づいて、新たに出力する情報を生成する第1の層を有する復元器を学習する
ことを特徴とする請求項3に記載の学習装置。 - 前記学習部は、前記第1の層として、DPCN(Deep Predictive Coding Networks)の構造を有する復元器を学習する
ことを特徴とする請求項3または4に記載の学習装置。 - 前記学習部は、前記符号化器として、前記単語群に含まれる各単語を入力する第3の層と、各単語の属性を入力する第4の層とを有し、当該第3の層および第4の層の出力から出力する特徴を生成する符号化器を学習する
ことを特徴とする請求項1〜5のうちいずれか1つに記載の学習装置。 - 所定の文章に含まれる単語群を抽出する抽出工程と、
前記単語群に含まれる各単語が前記文章中に出現する順序とともに、各単語が影響を受ける文法構造を重みとして学習するための符号化器と、前記単語群に含まれる各単語と、当該各単語の属性と、当該各単語が前記文章中に出現する順序とを前記文章中における各単語の属性系列とともに前記特徴から復元する復元器とを学習する学習工程と
を含むことを特徴とする学習方法で生成される符号化器と復元器とからなるリカレントニューラルネットワークを含むプログラムパラメータ。 - 学習装置が実行する学習方法であって、
所定の文章に含まれる単語群を抽出する抽出工程と、
前記単語群に含まれる各単語が前記文章中に出現する順序とともに、各単語が影響を受ける文法構造を重みとして学習するための符号化器と、前記単語群に含まれる各単語と、当該各単語の属性と、当該各単語が前記文章中に出現する順序とを前記文章中における各単語の属性系列とともに前記特徴から復元する復元器とを学習する学習工程と
を含むことを特徴とする学習方法。 - 単語群に含まれる各単語が前記文章中に出現する順序とともに、各単語が影響を受ける文法構造を重みとして学習するための符号化器と、
前記単語群に含まれる各単語と、当該各単語の属性と、当該各単語が前記文章中に出現する順序とを前記文章中における各単語の属性系列とともに前記特徴から復元する復元器と
を含み
前記符号化器が有する入力層に入力された所定の文章に関する情報に対し、前記復元器が有する出力層以外の層に属する各要素の出力と、各要素の出力に対する重みとに基づく演算を行うことにより、前記復元器が有する出力層から、前記単語群に含まれる各単語と各単語が前記文章中に出現する順序と前記文章中における各単語の属性系列とを示す情報を出力するよう
コンピュータを機能させるためのモデル。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017141314A JP2019021218A (ja) | 2017-07-20 | 2017-07-20 | 学習装置、プログラムパラメータ、学習方法およびモデル |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017141314A JP2019021218A (ja) | 2017-07-20 | 2017-07-20 | 学習装置、プログラムパラメータ、学習方法およびモデル |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2019021218A true JP2019021218A (ja) | 2019-02-07 |
Family
ID=65353629
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017141314A Pending JP2019021218A (ja) | 2017-07-20 | 2017-07-20 | 学習装置、プログラムパラメータ、学習方法およびモデル |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2019021218A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113341419A (zh) * | 2021-05-25 | 2021-09-03 | 成都信息工程大学 | 基于VAN-ConvLSTM的天气外推方法及系统 |
CN113424208A (zh) * | 2019-03-14 | 2021-09-21 | 欧姆龙株式会社 | 学习装置、推测装置、数据生成装置、学习方法以及学习程序 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01255966A (ja) * | 1988-04-06 | 1989-10-12 | Nec Corp | 文法規則適用順序学習方式 |
JPH05233707A (ja) * | 1992-02-17 | 1993-09-10 | Mitsubishi Electric Corp | 情報データベース装置 |
US20150356401A1 (en) * | 2014-06-06 | 2015-12-10 | Google Inc. | Generating representations of input sequences using neural networks |
JP2018045656A (ja) * | 2016-09-16 | 2018-03-22 | ヤフー株式会社 | 学習装置、プログラムパラメータおよび学習方法 |
JP2018147073A (ja) * | 2017-03-02 | 2018-09-20 | 公立大学法人首都大学東京 | 出力文生成装置、出力文生成方法および出力文生成プログラム |
-
2017
- 2017-07-20 JP JP2017141314A patent/JP2019021218A/ja active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01255966A (ja) * | 1988-04-06 | 1989-10-12 | Nec Corp | 文法規則適用順序学習方式 |
JPH05233707A (ja) * | 1992-02-17 | 1993-09-10 | Mitsubishi Electric Corp | 情報データベース装置 |
US20150356401A1 (en) * | 2014-06-06 | 2015-12-10 | Google Inc. | Generating representations of input sequences using neural networks |
JP2018045656A (ja) * | 2016-09-16 | 2018-03-22 | ヤフー株式会社 | 学習装置、プログラムパラメータおよび学習方法 |
JP2018147073A (ja) * | 2017-03-02 | 2018-09-20 | 公立大学法人首都大学東京 | 出力文生成装置、出力文生成方法および出力文生成プログラム |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113424208A (zh) * | 2019-03-14 | 2021-09-21 | 欧姆龙株式会社 | 学习装置、推测装置、数据生成装置、学习方法以及学习程序 |
CN113341419A (zh) * | 2021-05-25 | 2021-09-03 | 成都信息工程大学 | 基于VAN-ConvLSTM的天气外推方法及系统 |
CN113341419B (zh) * | 2021-05-25 | 2022-11-01 | 成都信息工程大学 | 基于VAN-ConvLSTM的天气外推方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bocklisch et al. | Rasa: Open source language understanding and dialogue management | |
CN107066464B (zh) | 语义自然语言向量空间 | |
JP6355800B1 (ja) | 学習装置、生成装置、学習方法、生成方法、学習プログラム、および生成プログラム | |
GB2573189A (en) | Generating a topic-based summary of textual content | |
US11521110B2 (en) | Learning apparatus, learning method, and non-transitory computer readable storage medium | |
GB2546360A (en) | Image captioning with weak supervision | |
CN115244587A (zh) | 高效基础事实注释 | |
US11531927B2 (en) | Categorical data transformation and clustering for machine learning using natural language processing | |
JP7205839B2 (ja) | データ生成モデル学習装置、潜在変数生成モデル学習装置、翻訳データ生成装置、データ生成モデル学習方法、潜在変数生成モデル学習方法、翻訳データ生成方法、プログラム | |
JP2017199383A (ja) | モデル | |
JP6975610B2 (ja) | 学習装置および学習方法 | |
JP7058556B2 (ja) | 判定装置、判定方法、および判定プログラム | |
JP6964481B2 (ja) | 学習装置、プログラムおよび学習方法 | |
JP2019021218A (ja) | 学習装置、プログラムパラメータ、学習方法およびモデル | |
JP6391617B2 (ja) | 学習装置、文章自動生成装置および学習方法 | |
JP6400038B2 (ja) | 抽出装置および抽出方法 | |
JP6680655B2 (ja) | 学習装置および学習方法 | |
JP2018028866A (ja) | 説明文生成方法、説明文生成モデル学習方法、及びプログラム | |
US20230168989A1 (en) | BUSINESS LANGUAGE PROCESSING USING LoQoS AND rb-LSTM | |
US20220215287A1 (en) | Self-supervised pretraining through text alignment | |
JP6979899B2 (ja) | 生成装置、学習装置、生成方法、学習方法、生成プログラム、及び学習プログラム | |
JP6526607B2 (ja) | 学習装置、学習方法、および学習プログラム | |
JP7017478B2 (ja) | 出力装置、出力方法および出力プログラム | |
JP6963988B2 (ja) | 提供装置、提供方法および提供プログラム | |
JP2018045630A (ja) | 情報処理装置、情報処理方法、およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20191101 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20191108 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200309 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210226 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210406 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210607 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20220111 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220411 |
|
C60 | Trial request (containing other claim documents, opposition documents) |
Free format text: JAPANESE INTERMEDIATE CODE: C60 Effective date: 20220411 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20220426 |
|
C21 | Notice of transfer of a case for reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C21 Effective date: 20220510 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20220624 |
|
C211 | Notice of termination of reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C211 Effective date: 20220628 |
|
C22 | Notice of designation (change) of administrative judge |
Free format text: JAPANESE INTERMEDIATE CODE: C22 Effective date: 20220823 |
|
C22 | Notice of designation (change) of administrative judge |
Free format text: JAPANESE INTERMEDIATE CODE: C22 Effective date: 20221011 |
|
C13 | Notice of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: C13 Effective date: 20221129 |
|
C28A | Non-patent document cited |
Free format text: JAPANESE INTERMEDIATE CODE: C2838 Effective date: 20221129 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230124 |
|
C23 | Notice of termination of proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C23 Effective date: 20230314 |
|
C03 | Trial/appeal decision taken |
Free format text: JAPANESE INTERMEDIATE CODE: C03 Effective date: 20230411 |
|
C30A | Notification sent |
Free format text: JAPANESE INTERMEDIATE CODE: C3012 Effective date: 20230411 |