JP7054645B2 - 生成装置、生成方法、生成プログラムおよびプログラムパラメータ - Google Patents
生成装置、生成方法、生成プログラムおよびプログラムパラメータ Download PDFInfo
- Publication number
- JP7054645B2 JP7054645B2 JP2018096595A JP2018096595A JP7054645B2 JP 7054645 B2 JP7054645 B2 JP 7054645B2 JP 2018096595 A JP2018096595 A JP 2018096595A JP 2018096595 A JP2018096595 A JP 2018096595A JP 7054645 B2 JP7054645 B2 JP 7054645B2
- Authority
- JP
- Japan
- Prior art keywords
- model
- layer
- input
- information
- generation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 34
- 230000008569 process Effects 0.000 claims description 17
- 238000013135 deep learning Methods 0.000 claims description 8
- 239000004033 plastic Substances 0.000 description 20
- 238000012549 training Methods 0.000 description 19
- 238000012545 processing Methods 0.000 description 18
- 230000008859 change Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 238000013528 artificial neural network Methods 0.000 description 5
- 230000015654 memory Effects 0.000 description 5
- 229920001169 thermoplastic Polymers 0.000 description 5
- 239000004416 thermosoftening plastic Substances 0.000 description 5
- 238000013459 approach Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 230000010365 information processing Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
〔1-1.生成装置の一例〕
まず、図1を用いて、生成装置が実行する処理の一例について説明する。なお、以下の説明では、生成装置が実行する処理の一例として、入力された情報を所定の特徴に基づいて分類するモデルの学習を行う処理の一例について記載するが、実施形態は、これに限定されるものではない。例えば、生成装置10は、単語、文章、音声データ、ナレッジデータベースのデータ、利用者に関する各種の利用者情報等、任意の情報に対して各種の処理を実行するモデルの学習に以下の生成処理を適用して良い。
近年、モデルとして、複数のノードを含むレイヤを多段に設定し、各レイヤ間のノードを接続経路を介して接続するとともに、接続経路に種々の接続係数を設定したDNNの技術が知られている。また、このようなDNN以外にも、RNN(Reccurent Neural Network)、LSTM(Long short-term memory)、CNN(Convolutional Neural Network)、DSSM(Deep Structured Semantic Models)といった、ノードを含むレイヤを多段に設定した各種のモデルが知られている。
以下、図1を用いて、生成装置10が実行する処理の一例について説明する。まず、生成装置10は、情報管理装置110から学習データを取得する(ステップS1)。例えば、生成装置10は、入力情報と対応情報との組を取得する。このような場合、生成装置10は、第1モデルM10の学習を行う(ステップS2)。
上述した例では、生成装置10は、レイヤL1に含まれるノードと、レイヤL2に含まれるノードとの接続を1つずつずらした。しかしながら、実施形態は、これに限定されるものではない。例えば、生成装置10は、レイヤL1に含まれるノードと、レイヤL2に含まれるノードとの接続を任意の数だけずらしてもよい。
ここで、生成装置10は、第2モデルM20の再学習を行ってもよい。例えば、生成装置10は、第1学習データを用いて第1モデルM10の学習を行い、第1モデルM10を可塑変形した第2モデルM20を生成する。そして、生成装置10は、第2学習データを用いて、第2モデルM20の再学習を行い、再学習を行った第2モデルM20を用いて、利用者から取得した情報の分類処理を行ってもよい。
以下、上記した提供処理を実現する生成装置10が有する機能構成の一例について説明する。図2は、実施形態に係る生成装置の構成例を示す図である。図2に示すように、生成装置10は、通信部20、記憶部30、および制御部40を有する。
次に、図5を用いて、生成装置10が実行する提供処理の流れの一例について説明する。図5は、実施形態に係る生成処理の流れの一例を説明するフローチャートである。まず、生成装置10は、学習データを取得し(ステップS101)、学習データが有する特徴を第1モデルM10に学習させる(ステップS102)。続いて、生成装置10は、所定のレイヤ間における接続経路をずらすことで、モデルを可塑変形させる(ステップS103)。そして、生成装置10は、可塑変形させたモデルを用いて、取得情報の分類を行い(ステップS104)、処理を終了する。
上記では、生成装置10による提供処理の一例について説明した。しかしながら、実施形態は、これに限定されるものではない。以下、生成装置10が実行する生成処理のバリエーションについて説明する。
上述した例では、生成装置10は、生成装置10内で生成処理を実行した。しかしながら、実施形態は、これに限定されるものではない。例えば、生成装置10は、入出力装置100と情報の送受信を行うフロントエンドサーバと、上述した生成処理を実行するバックエンドサーバとにより実現されてもよい。このような場合、例えば、フロントエンドサーバは、図2に示す提供部44を有し、バックエンドサーバは、図2に示す学習部41、取得部42、および生成部43を有する。また、生成装置10は、学習データデータベース31やモデルデータベース32を外部のストレージサーバに記憶させてもよい。
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文章中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
また、上述してきた実施形態に係る生成装置10は、例えば図6に示すような構成のコンピュータ1000によって実現される。図6は、ハードウェア構成の一例を示す図である。コンピュータ1000は、出力装置1010、入力装置1020と接続され、演算装置1030、一次記憶装置1040、二次記憶装置1050、出力IF(Interface)1060、入力IF1070、ネットワークIF1080がバス1090により接続された形態を有する。
上述したように、生成装置10は、深層学習装置において、複数のレイヤを有し、各レイヤに含まれる複数のノードを接続した第1モデルM10であって、所定の入力情報が入力された場合に、入力情報と対応する出力情報を出力するように学習が行われた第1モデルM10を取得する。そして、生成装置10は、第1モデルM10のうち、所定の第1レイヤと第1レイヤに隣接する第2レイヤとに含まれるノード間の接続をずらすことで、第1モデルM10を可塑変形させた第2モデルM20を生成する。このずらしの効果は、DNN等の多段の層をもつ深層学習装置において、接続されている近い関係性をもつノードに対して、近さをそれほど変えない接続変化をもたらし、過学習の抑制効果を示す。このため、生成装置10は、第1モデルM10において生じる過学習の影響を軽減した第2モデルM20を生成することができるので、モデルの分類精度を改善することができる。
20 通信部
30 記憶部
31 学習データデータベース
32 モデルデータベース
40 制御部
41 学習部
42 取得部
43 生成部
44 提供部
100 入出力装置
110 情報管理装置
Claims (8)
- 深層学習装置において、複数のレイヤを有し、各レイヤに含まれる複数のノードを接続した第1モデルであって、所定の入力情報が入力された場合に、当該入力情報と対応する出力情報を出力するように学習が行われた第1モデルを取得する取得部と、
前記取得部により取得された第1モデルのうち、所定の第1レイヤと当該第1レイヤに隣接する第2レイヤとに含まれるノード間の接続を所定の方向にずらすことで、前記第1モデルを可塑変形させた第2モデルを生成する生成部と
を有することを特徴とする生成装置。 - 前記生成部は、前記第1レイヤに含まれるノードと前記第2レイヤに含まれるノードとを接続する接続経路のうち、接続係数が所定の条件を満たす接続経路を特定し、特定した接続経路が接続するノードの一方を他のノードに変更することで、前記第2モデルを生成する
ことを特徴とする請求項1に記載の生成装置。 - 前記生成部は、前記接続係数が所定の閾値を下回る接続経路を特定する
ことを特徴とする請求項2に記載の生成装置。 - 前記生成部は、特定した接続経路が接続する2つのノードのうち、前記出力情報を出力する出力レイヤ側のレイヤに含まれるノードを、同じレイヤに含まれる他のノードに変更する
ことを特徴とする請求項2または3に記載の生成装置。 - 前記生成部は、特定した接続経路が接続する2つのノードのうち、前記出力情報を出力する出力レイヤ側のレイヤに含まれるノードを、当該ノードと隣接する他のノードに変更する
ことを特徴とする請求項4に記載の生成装置。 - 生成装置が実行する生成方法であって、
深層学習装置において、複数のレイヤを有し、各レイヤに含まれる複数のノードを接続した第1モデルであって、所定の入力情報が入力された場合に、当該入力情報と対応する出力情報を出力するように学習が行われた第1モデルを取得する取得工程と、
前記取得工程により取得された第1モデルのうち、所定の第1レイヤと当該第1レイヤに隣接する第2レイヤとに含まれるノード間の接続を所定の方向にずらすことで、前記第1モデルを可塑変形させた第2モデルを生成する生成工程と
を含むことを特徴とする生成方法。 - 深層学習装置において、複数のレイヤを有し、各レイヤに含まれる複数のノードを接続した第1モデルであって、所定の入力情報が入力された場合に、当該入力情報と対応する出力情報を出力するように学習が行われた第1モデルを取得する取得手順と、
前記取得手順により取得された第1モデルのうち、所定の第1レイヤと当該第1レイヤに隣接する第2レイヤとに含まれるノード間の接続を所定の方向にずらすことで、前記第1モデルを可塑変形させた第2モデルを生成する生成手順と
をコンピュータに実行させるための生成プログラム。 - 深層学習装置において、複数のレイヤを有し、各レイヤに含まれる複数のノードを接続した第1モデルであって、所定の入力情報が入力された場合に、当該入力情報と対応する出力情報を出力するように学習が行われた第1モデルを取得する取得工程と、
前記取得工程により取得された第1モデルのうち、所定の第1レイヤと当該第1レイヤに隣接する第2レイヤとに含まれるノード間の接続を所定の方向にずらすことで、前記第1モデルを可塑変形させた第2モデルを生成する生成工程と
を含むことを特徴とする生成方法で生成されるモデルの情報を含むプログラムパラメータ。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018096595A JP7054645B2 (ja) | 2018-05-18 | 2018-05-18 | 生成装置、生成方法、生成プログラムおよびプログラムパラメータ |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018096595A JP7054645B2 (ja) | 2018-05-18 | 2018-05-18 | 生成装置、生成方法、生成プログラムおよびプログラムパラメータ |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019200743A JP2019200743A (ja) | 2019-11-21 |
JP7054645B2 true JP7054645B2 (ja) | 2022-04-14 |
Family
ID=68612191
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018096595A Active JP7054645B2 (ja) | 2018-05-18 | 2018-05-18 | 生成装置、生成方法、生成プログラムおよびプログラムパラメータ |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7054645B2 (ja) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170364799A1 (en) | 2016-06-15 | 2017-12-21 | Kneron Inc. | Simplifying apparatus and simplifying method for neural network |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2907486B2 (ja) * | 1990-04-17 | 1999-06-21 | 富士通株式会社 | ニューラルネットワーク装置 |
JPH0991263A (ja) * | 1995-09-20 | 1997-04-04 | Hitachi Medical Corp | ニューラルネットワーク構造最適化装置ならびに方法 |
-
2018
- 2018-05-18 JP JP2018096595A patent/JP7054645B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170364799A1 (en) | 2016-06-15 | 2017-12-21 | Kneron Inc. | Simplifying apparatus and simplifying method for neural network |
Also Published As
Publication number | Publication date |
---|---|
JP2019200743A (ja) | 2019-11-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11521110B2 (en) | Learning apparatus, learning method, and non-transitory computer readable storage medium | |
KR102071582B1 (ko) | 딥 뉴럴 네트워크(Deep Neural Network)를 이용하여 문장이 속하는 클래스(class)를 분류하는 방법 및 장치 | |
US20190005399A1 (en) | Learning device, generation device, learning method, generation method, and non-transitory computer readable storage medium | |
TWI634488B (zh) | 人造神經網路之簡化裝置和簡化方法以及應用於簡化人造神經網路之非暫態電腦可讀取儲存媒體 | |
US20190228336A1 (en) | Training apparatus, training method, and non-transitory computer readable storage medium | |
JP6975610B2 (ja) | 学習装置および学習方法 | |
KR102264234B1 (ko) | 문서 분류에 있어서 기여도가 높은 단어 및 문장을 제공하는 설명이 부가된 문서 분류 방법 | |
US20190354533A1 (en) | Information processing device, information processing method, and non-transitory computer-readable recording medium | |
US11580362B2 (en) | Learning apparatus, generation apparatus, classification apparatus, learning method, and non-transitory computer readable storage medium | |
KR102697095B1 (ko) | Qa 모델을 이용하여 지식 그래프를 구축하는 방법, 장치 및 컴퓨터 프로그램 | |
JP7054607B2 (ja) | 生成装置、生成方法および生成プログラム | |
JP7058556B2 (ja) | 判定装置、判定方法、および判定プログラム | |
JP6963988B2 (ja) | 提供装置、提供方法および提供プログラム | |
JP2019021218A (ja) | 学習装置、プログラムパラメータ、学習方法およびモデル | |
JP7054645B2 (ja) | 生成装置、生成方法、生成プログラムおよびプログラムパラメータ | |
JP6964481B2 (ja) | 学習装置、プログラムおよび学習方法 | |
JP6910873B2 (ja) | 特定装置および特定方法 | |
JP6558765B2 (ja) | 処理装置、処理方法、推測装置、推測方法、およびプログラム | |
JP6680655B2 (ja) | 学習装置および学習方法 | |
JP6705506B2 (ja) | 学習プログラム、情報処理装置および学習方法 | |
JP7265837B2 (ja) | 学習装置および学習方法 | |
JP2020004054A (ja) | 出力装置、出力方法および出力プログラム | |
JP6942028B2 (ja) | 比較装置、比較方法および比較プログラム | |
JP2019109789A (ja) | 提供装置、提供方法および提供プログラム | |
US20210264264A1 (en) | Learning device, learning method, learning program, evaluation device, evaluation method, and evaluation program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20191101 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20191108 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200917 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210928 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210930 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211126 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220315 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220404 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7054645 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |