JP6784162B2 - 情報処理装置、プログラム及び情報処理方法 - Google Patents
情報処理装置、プログラム及び情報処理方法 Download PDFInfo
- Publication number
- JP6784162B2 JP6784162B2 JP2016241629A JP2016241629A JP6784162B2 JP 6784162 B2 JP6784162 B2 JP 6784162B2 JP 2016241629 A JP2016241629 A JP 2016241629A JP 2016241629 A JP2016241629 A JP 2016241629A JP 6784162 B2 JP6784162 B2 JP 6784162B2
- Authority
- JP
- Japan
- Prior art keywords
- neural network
- polynomial
- cpu
- layer
- information processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/11—Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Operations Research (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Image Analysis (AREA)
Description
以下実施の形態を、図面を参照して説明する。図1は処理の概要を示す説明図である。情報処理装置1は、例えばサーバコンピュータ、パーソナルコンピュータ、タブレット、スマートフォンまたは携帯電話機等である。以下では情報処理装置1をコンピュータ1と読み替えて説明する。コンピュータ1は深層のニューラルネットワークを取得する。コンピュータ1は取得したニューラルネットワークを複数に分割する。コンピュータ1は分割した各ニューラルネットワークに対応する多項式ニューラルネットワークを生成する。コンピュータ1は分割したニューラルネットワークから得られた入出力特性に基づき、多項式ニューラルネットワークについて学習処理を行い、パラメータを特定する。コンピュータ1は、パラメータを特定した複数の多項式ニューラルネットワークを連結する。以下詳細を説明する。
実施の形態2は再分割する形態に関する。図17は再分割処理の手順を示すフローチャートである。コンピュータ1のCPU11は、ステップS159でYESの後、すなわち損失関数が閾値より大きい場合、中間素子数が、上限数に達したか否かを判断する(ステップS171)。CPU11は、上限数に達していない場合(ステップS171でNO)、処理をステップS172へ移行させる。CPU11は、実施の形態1で述べたように次数及び中間素子数を変更する(ステップS172)。その後CPU11は、処理を実施の形態1で述べたステップS155へ移行させる。
図19は上述した形態のコンピュータ1の動作を示す機能ブロック図である。CPU11が制御プログラム15Pを実行することにより、コンピュータ1は以下のように動作する。分割部191は、ニューラルネットワークを複数に分割する。特定部192は、分割したニューラルネットワークの入出力特性に基づいて、分割した各ニューラルネットワークに対応する各多項式ニューラルネットワークのパラメータを特定する。連結部193は特定後の各多項式ニューラルネットワークを連結する。
ニューラルネットワークを複数に分割する分割部と、
分割したニューラルネットワークの入出力特性に基づいて、分割した各ニューラルネットワークに対応する各多項式ニューラルネットワークのパラメータを特定する特定部と、
特定後の各多項式ニューラルネットワークを連結する連結部と
備える情報処理装置。
(付記2)
前記特定部は、
前記多項式ニューラルネットワークに対応する対応値が、所定条件を満たさない場合、前記パラメータを変更する
付記1に記載の情報処理装置。
(付記3)
前記パラメータは前記多項式ニューラルネットワークの次数及び中間素子数を含み、
前記特定部は、
前記中間素子数の上限数を超えない範囲で、各多項式ニューラルネットワークの次数及び中間素子数を特定する
付記1または2に記載の情報処理装置。
(付記4)
前記特定部は、
分割したニューラルネットワークの入出力特性に基づき、前記多項式ニューラルネットワークの損失関数を算出し、
算出した損失関数が閾値より大きいか否か判断し、
閾値より大きいと判断した場合に、前記次数及び中間素子数を変更する
付記3に記載の情報処理装置。
(付記5)
前記パラメータは重みパラメータを含み、
前記損失関数の勾配を算出する勾配算出部と、
算出した勾配に基づき、重みパラメータを算出する重み算出部と
を備える付記4に記載の情報処理装置。
(付記6)
次数及び中間素子数を変更した後の損失関数が閾値より大きい場合に、分割した多項式ニューラルネットワークをさらに分割する再分割部
を備える付記4または5に記載の情報処理装置。
(付記7)
前記連結部は、
損失関数が閾値以下となるパラメータにて特定された各多項式ニューラルネットワークを連結する
付記4から6のいずれか一つに記載の情報処理装置。
(付記8)
コンピュータに、
ニューラルネットワークを複数に分割し、
分割したニューラルネットワークの入出力特性に基づいて、分割した各ニューラルネットワークに対応する各多項式ニューラルネットワークのパラメータを特定し、
特定後の各多項式ニューラルネットワークを連結する
処理を実行させるプログラム。
(付記9)
コンピュータに、
ニューラルネットワークを複数に分割し、
分割したニューラルネットワークの入出力特性に基づいて、分割した各ニューラルネットワークに対応する各多項式ニューラルネットワークのパラメータを特定し、
特定後の各多項式ニューラルネットワークを連結する
処理を実行させる情報処理方法。
1A 可搬型記録媒体
1B 半導体メモリ
10A 読み取り部
11 CPU
12 RAM
13 入力部
14 表示部
15 記憶部
15P 制御プログラム
16 通信部
18 時計部
N 通信網
Claims (6)
- ニューラルネットワークを複数に分割する分割部と、
分割したニューラルネットワークの入出力特性に基づいて、分割した各ニューラルネットワークに対応する各多項式ニューラルネットワークのパラメータを特定する特定部と、
特定後の各多項式ニューラルネットワークを連結する連結部と
備える情報処理装置。 - 前記特定部は、
前記多項式ニューラルネットワークに対応する対応値が、所定条件を満たさない場合、前記パラメータを変更する
請求項1に記載の情報処理装置。 - 前記パラメータは前記多項式ニューラルネットワークの次数及び中間素子数を含み、
前記特定部は、
前記中間素子数の上限数を超えない範囲で、各多項式ニューラルネットワークの次数及び中間素子数を特定する
請求項1または2に記載の情報処理装置。 - 前記特定部は、
分割したニューラルネットワークの入出力特性に基づき、前記多項式ニューラルネットワークの損失関数を算出し、
算出した損失関数が閾値より大きいか否か判断し、
閾値より大きいと判断した場合に、前記次数及び中間素子数を変更する
請求項3に記載の情報処理装置。 - コンピュータに、
ニューラルネットワークを複数に分割し、
分割したニューラルネットワークの入出力特性に基づいて、分割した各ニューラルネットワークに対応する各多項式ニューラルネットワークのパラメータを特定し、
特定後の各多項式ニューラルネットワークを連結する
処理を実行させるプログラム。 - コンピュータに、
ニューラルネットワークを複数に分割し、
分割したニューラルネットワークの入出力特性に基づいて、分割した各ニューラルネットワークに対応する各多項式ニューラルネットワークのパラメータを特定し、
特定後の各多項式ニューラルネットワークを連結する
処理を実行させる情報処理方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016241629A JP6784162B2 (ja) | 2016-12-13 | 2016-12-13 | 情報処理装置、プログラム及び情報処理方法 |
US15/819,292 US11093817B2 (en) | 2016-12-13 | 2017-11-21 | Information processing device and information processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016241629A JP6784162B2 (ja) | 2016-12-13 | 2016-12-13 | 情報処理装置、プログラム及び情報処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018097612A JP2018097612A (ja) | 2018-06-21 |
JP6784162B2 true JP6784162B2 (ja) | 2020-11-11 |
Family
ID=62489365
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016241629A Active JP6784162B2 (ja) | 2016-12-13 | 2016-12-13 | 情報処理装置、プログラム及び情報処理方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US11093817B2 (ja) |
JP (1) | JP6784162B2 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017136483A (ja) * | 2017-05-19 | 2017-08-10 | シャープ株式会社 | 洗濯機 |
JP2017136484A (ja) * | 2017-05-19 | 2017-08-10 | シャープ株式会社 | 洗濯機 |
JP2017136481A (ja) * | 2017-05-19 | 2017-08-10 | シャープ株式会社 | 洗濯機 |
JP6291112B2 (ja) * | 2017-05-19 | 2018-03-14 | シャープ株式会社 | 洗濯機 |
JP7056345B2 (ja) * | 2018-04-18 | 2022-04-19 | 日本電信電話株式会社 | データ分析システム、方法、及びプログラム |
WO2019210300A1 (en) | 2018-04-27 | 2019-10-31 | Carnegie Mellon University | Polynomial convolutional neural network with late fan-out |
JP6775251B2 (ja) * | 2018-05-22 | 2020-10-28 | 京楽産業.株式会社 | 遊技機 |
CN111382835A (zh) * | 2018-12-27 | 2020-07-07 | 中科寒武纪科技股份有限公司 | 一种神经网络压缩方法、电子设备及计算机可读介质 |
CN111523654B (zh) * | 2019-02-03 | 2024-03-29 | 上海寒武纪信息科技有限公司 | 处理装置及方法 |
JPWO2020189496A1 (ja) * | 2019-03-15 | 2020-09-24 | ||
US11556450B2 (en) * | 2019-10-11 | 2023-01-17 | International Business Machines Corporation | Hybrid data-model parallelism for efficient deep learning |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3922536A (en) * | 1974-05-31 | 1975-11-25 | Rca Corp | Multionomial processor system |
DE3804946A1 (de) | 1988-02-18 | 1989-08-31 | Tetra Pak Rausing & Co Kg | Verfahren und vorrichtung zum vereinzeln von ebenen teilen |
JPH0738186B2 (ja) * | 1989-03-13 | 1995-04-26 | シャープ株式会社 | 自己拡張形ニユーラル・ネットワーク |
JPH05108595A (ja) * | 1991-10-17 | 1993-04-30 | Hitachi Ltd | ニユーラルネツトワークの分散学習装置 |
JPH0635889A (ja) | 1992-07-20 | 1994-02-10 | Hitachi Ltd | ニューラルネットワーク装置及びその学習方法 |
US5517667A (en) | 1993-06-14 | 1996-05-14 | Motorola, Inc. | Neural network that does not require repetitive training |
JP3430673B2 (ja) * | 1994-10-19 | 2003-07-28 | 富士ゼロックス株式会社 | 色変換装置 |
JP6164639B2 (ja) | 2013-05-23 | 2017-07-19 | 国立研究開発法人情報通信研究機構 | ディープ・ニューラルネットワークの学習方法、及びコンピュータプログラム |
US9483728B2 (en) * | 2013-12-06 | 2016-11-01 | International Business Machines Corporation | Systems and methods for combining stochastic average gradient and hessian-free optimization for sequence training of deep neural networks |
US20160267380A1 (en) * | 2015-03-13 | 2016-09-15 | Nuance Communications, Inc. | Method and System for Training a Neural Network |
-
2016
- 2016-12-13 JP JP2016241629A patent/JP6784162B2/ja active Active
-
2017
- 2017-11-21 US US15/819,292 patent/US11093817B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US11093817B2 (en) | 2021-08-17 |
JP2018097612A (ja) | 2018-06-21 |
US20180165571A1 (en) | 2018-06-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6784162B2 (ja) | 情報処理装置、プログラム及び情報処理方法 | |
US11003998B2 (en) | Rule creation using MDP and inverse reinforcement learning | |
US20170193361A1 (en) | Neural network training performance optimization framework | |
WO2017200597A1 (en) | Progressive neural networks | |
JP6831347B2 (ja) | 学習装置、学習方法および学習プログラム | |
CN115618941A (zh) | 训练精炼的机器学习模型 | |
CN106471525A (zh) | 增强神经网络以生成附加输出 | |
WO2015077557A1 (en) | Generation of weights in machine learning | |
JP6870508B2 (ja) | 学習プログラム、学習方法及び学習装置 | |
CN114492279B (zh) | 一种模拟集成电路的参数优化方法及系统 | |
US10630995B2 (en) | Video compressed sensing reconstruction method, system, electronic device, and storage medium | |
US20230222326A1 (en) | Method and system for training a neural network model using gradual knowledge distillation | |
CN111144574B (zh) | 使用指导者模型训练学习者模型的人工智能系统和方法 | |
CN113919401A (zh) | 基于星座图特征的调制类型识别方法、装置、计算机设备 | |
US20190180182A1 (en) | Activation Function Functional Block for Electronic Devices | |
CN112819151A (zh) | 用于识别图像的方法和设备以及训练方法 | |
US20180232152A1 (en) | Gated end-to-end memory network | |
CN110765843A (zh) | 人脸验证方法、装置、计算机设备及存储介质 | |
US20220092406A1 (en) | Meta-feature training models for machine learning algorithms | |
US20200202212A1 (en) | Learning device, learning method, and computer-readable recording medium | |
US20220414461A1 (en) | Inference method, information processing apparatus, and computer-readable recording medium | |
US20220318230A1 (en) | Text to question-answer model system | |
JP7242590B2 (ja) | 機械学習モデル圧縮システム、プルーニング方法及びプログラム | |
CN114154380A (zh) | 火箭弹性运动方程系数的计算方法、装置、终端设备及介质 | |
CN114676835A (zh) | 基于模式的神经网络修剪 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190910 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200729 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200923 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201006 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6784162 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |