JP6950701B2 - モデル推定装置、モデル推定方法およびモデル推定プログラム - Google Patents
モデル推定装置、モデル推定方法およびモデル推定プログラム Download PDFInfo
- Publication number
- JP6950701B2 JP6950701B2 JP2018543764A JP2018543764A JP6950701B2 JP 6950701 B2 JP6950701 B2 JP 6950701B2 JP 2018543764 A JP2018543764 A JP 2018543764A JP 2018543764 A JP2018543764 A JP 2018543764A JP 6950701 B2 JP6950701 B2 JP 6950701B2
- Authority
- JP
- Japan
- Prior art keywords
- node
- model
- parameters
- neural network
- parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/082—Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Human Resources & Organizations (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Pure & Applied Mathematics (AREA)
- Strategic Management (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Operations Research (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Algebra (AREA)
- Molecular Biology (AREA)
- Game Theory and Decision Science (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Development Economics (AREA)
- Biophysics (AREA)
- Educational Administration (AREA)
- Biomedical Technology (AREA)
- Quality & Reliability (AREA)
- Health & Medical Sciences (AREA)
- Marketing (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
Description
である。また、W(l)は、l層とl−1層との間の重み行列を表わし、
である。なお、以下の説明では、表記を単純にするため、M=J0で表す。また、bは、最上位層のバイアスであり、
である。また、c(l)は、残りの層におけるバイアスに対応し、
である。
<参考文献1>
国際公開第2014/188659号
<参考文献2>
特表2016−520220号公報
<参考文献3>
Mnih, A. and Gregor, K., "Neural variational inference and learning in belief networks", ICML, JMLR: W&CP vol.32, pp.1791-1799, 2014
20 パラメータ推定部
30 変分確率推定部
40 ノード削除判定部
50 収束判定部
100 モデル推定装置
Claims (10)
- ニューラルネットワークモデルを推定するモデル推定装置であって、
推定されるニューラルネットワークモデルにおける観測値データおよび隠れ層のノードに関する対数周辺化尤度の下限を最大化する当該ニューラルネットワークモデルのパラメータを推定するパラメータ推定部と、
前記対数周辺化尤度の下限を最大化する前記ノードの変分確率のパラメータを推定する変分確率推定部と、
パラメータが推定された変分確率に基づいて削除対象のノードを判定し、削除対象に該当すると判定されたノードを削除するノード削除判定部と、
前記変分確率の変化に基づいて、前記ニューラルネットワークモデルの収束性を判定する収束判定部とを備え、
前記収束判定部によって前記ニューラルネットワークモデルが収束したと判定されるまで、前記パラメータ推定部による前記パラメータの推定、前記変分確率推定部による前記変分確率のパラメータの推定および前記ノード削除判定部による該当するノードの削除を繰り返す
ことを特徴とするモデル推定装置。 - ノード削除判定部は、変分確率の和が予め定めた閾値以下のノードを削除対象のノードと判定する
請求項1記載のモデル推定装置。 - パラメータ推定部は、観測値データ、パラメータ、および変分確率に基づいて、対数周辺化尤度の下限を最大化するニューラルネットワークモデルのパラメータを推定する
請求項1または請求項2記載のモデル推定装置。 - パラメータ推定部は、推定したパラメータを用いて元のパラメータを更新する
請求項3記載のモデル推定装置。 - 変分確率推定部は、観測値データ、パラメータ、および変分確率に基づいて、対数周辺化尤度の下限を最大化する変分確率のパラメータを推定する
請求項1から請求項4のうちのいずれか1項に記載のモデル推定装置。 - 変分確率推定部は、推定したパラメータを用いて元のパラメータを更新する
請求項5記載のモデル推定装置。 - パラメータ推定部は、ラプラス法に基づいて対数周辺化尤度を近似し、近似した対数周辺化尤度の下限を最大化するパラメータを推定し、
変分確率推定部は、前記対数周辺化尤度の下限を最大化するように変分確率のパラメータを変分分布の仮定の元で推定する
請求項1から請求項6のうちのいずれか1項に記載のモデル推定装置。 - ニューラルネットワークモデルを推定するモデル推定方法であって、
推定されるニューラルネットワークモデルにおける観測値データおよび隠れ層のノードに関する対数周辺化尤度の下限を最大化する当該ニューラルネットワークモデルのパラメータを推定し、
前記対数周辺化尤度の下限を最大化する前記ノードの変分確率のパラメータを推定し、
パラメータが推定された変分確率に基づいて削除対象のノードを判定し、削除対象に該当すると判定されたノードを削除し、
前記変分確率の変化に基づいて、前記ニューラルネットワークモデルの収束性を判定し、
前記ニューラルネットワークモデルが収束したと判定されるまで、前記パラメータの推定、前記変分確率のパラメータの推定および該当するノードの削除を繰り返す
ことを特徴とするモデル推定方法。 - 変分確率の和が予め定めた閾値以下のノードを削除対象のノードと判定する
請求項8記載のモデル推定方法。 - ニューラルネットワークモデルを推定するコンピュータに適用されるモデル推定プログラムであって、
前記コンピュータに、
推定されるニューラルネットワークモデルにおける観測値データおよび隠れ層のノードに関する対数周辺化尤度の下限を最大化する当該ニューラルネットワークモデルのパラメータを推定するパラメータ推定処理、
前記対数周辺化尤度の下限を最大化する前記ノードの変分確率のパラメータを推定する変分確率推定処理、
パラメータが推定された変分確率に基づいて削除対象のノードを判定し、削除対象に該当すると判定されたノードを削除するノード削除判定処理、および、
前記変分確率の変化に基づいて、前記ニューラルネットワークモデルの収束性を判定する収束判定処理を実行させ、
前記収束判定処理で前記ニューラルネットワークモデルが収束したと判定されるまで、前記パラメータ推定処理、前記変分確率推定処理および前記ノード削除判定処理を繰り返させる
ためのモデル推定プログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016199103 | 2016-10-07 | ||
JP2016199103 | 2016-10-07 | ||
PCT/JP2017/029476 WO2018066237A1 (ja) | 2016-10-07 | 2017-08-16 | モデル推定装置、モデル推定方法およびモデル推定プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2018066237A1 JPWO2018066237A1 (ja) | 2019-07-18 |
JP6950701B2 true JP6950701B2 (ja) | 2021-10-13 |
Family
ID=61831427
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018543764A Active JP6950701B2 (ja) | 2016-10-07 | 2017-08-16 | モデル推定装置、モデル推定方法およびモデル推定プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20200042872A1 (ja) |
JP (1) | JP6950701B2 (ja) |
WO (1) | WO2018066237A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7408325B2 (ja) * | 2019-09-13 | 2024-01-05 | キヤノン株式会社 | 情報処理装置、学習方法およびプログラム |
JPWO2021193754A1 (ja) * | 2020-03-25 | 2021-09-30 |
-
2017
- 2017-08-16 JP JP2018543764A patent/JP6950701B2/ja active Active
- 2017-08-16 WO PCT/JP2017/029476 patent/WO2018066237A1/ja active Application Filing
- 2017-08-16 US US16/339,934 patent/US20200042872A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
US20200042872A1 (en) | 2020-02-06 |
JPWO2018066237A1 (ja) | 2019-07-18 |
WO2018066237A1 (ja) | 2018-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6750854B2 (ja) | 情報処理装置および情報処理方法 | |
JP6969637B2 (ja) | 因果関係分析方法および電子デバイス | |
KR102445468B1 (ko) | 부스트 풀링 뉴럴 네트워크 기반의 데이터 분류 장치 및 그 데이터 분류 장치를 위한 뉴럴 네트워크 학습 방법 | |
WO2021007812A1 (zh) | 一种深度神经网络超参数优化方法、电子设备及存储介质 | |
JP2019525329A (ja) | 複数の機械学習タスクに関する機械学習モデルのトレーニング | |
Pandit et al. | Asymptotics of MAP inference in deep networks | |
JP6950701B2 (ja) | モデル推定装置、モデル推定方法およびモデル推定プログラム | |
Wang et al. | Bayesian change point analysis of linear models on graphs | |
US20140095616A1 (en) | Method and system for sampling online social networks | |
Cocucci et al. | Model error covariance estimation in particle and ensemble Kalman filters using an online expectation–maximization algorithm | |
WO2014020834A1 (ja) | 単語潜在トピック推定装置および単語潜在トピック推定方法 | |
WO2020034593A1 (zh) | 人群绩效特征预测中的缺失特征处理方法及装置 | |
CN110941793B (zh) | 一种网络流量数据填充方法、装置、设备及存储介质 | |
Malek et al. | Imputation of time series data via Kohonen self organizing maps in the presence of missing data | |
CN115796289A (zh) | 一种用于联邦贝叶斯学习的客户端选择方法及系统 | |
Shi et al. | Bayesian variable selection via particle stochastic search | |
CN115913995A (zh) | 一种基于卡尔曼滤波修正的云服务动态QoS预测方法 | |
JP2016520220A (ja) | 隠れ属性モデル推定装置、方法およびプログラム | |
JP7135824B2 (ja) | 学習装置、推定装置、学習方法、推定方法、及びプログラム | |
JP7477859B2 (ja) | 計算機、計算方法及びプログラム | |
CN111612101B (zh) | 非参数Waston混合模型的基因表达数据聚类方法、装置及设备 | |
JP7047665B2 (ja) | 学習装置、学習方法及び学習プログラム | |
JPWO2018066442A1 (ja) | モデル学習システム、モデル学習方法およびモデル学習プログラム | |
WO2023073814A1 (ja) | データ解析装置、方法およびプログラム | |
JP2019061623A (ja) | パラメータ推定装置、方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190312 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200702 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210824 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210906 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6950701 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |