JP7150651B2 - ニューラルネットワークのモデル縮約装置 - Google Patents
ニューラルネットワークのモデル縮約装置 Download PDFInfo
- Publication number
- JP7150651B2 JP7150651B2 JP2019055025A JP2019055025A JP7150651B2 JP 7150651 B2 JP7150651 B2 JP 7150651B2 JP 2019055025 A JP2019055025 A JP 2019055025A JP 2019055025 A JP2019055025 A JP 2019055025A JP 7150651 B2 JP7150651 B2 JP 7150651B2
- Authority
- JP
- Japan
- Prior art keywords
- contraction
- parameter
- weight matrix
- learning
- matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Description
<ニューラルネットワークの全体像>
まず、ニューラルネットワークの全体像について説明する。図1は、一般的なニューラルネットワークの全体像を説明する図である。ここでは、ニューラルネットワークの具体例として、静止画に対する畳み込みニューラルネットワークを挙げる。また、図1では、入力データの静止画を、畳み込みニューラルネットワークにより、ユーザが定義した各クラスに分類することを目的とするものとする。
次に、モデル縮約装置の構成について説明する。モデル縮約装置1は、ニューラルネットワークのモデル縮約を行う機能ブロックである。以下に説明するモデル縮約処理は、図1の入力層L10~最深の隠れ層L90に対して行われる。
次に、本実施の形態におけるモデル縮約方法について説明する。図4は、本発明の実施の形態1に係るモデル縮約方法の概要を示すフロー図である。図4のフローには、ステップS10~S60が含まれる。
次に、モデル縮約方法の具体例について説明する。図5は、モデル縮約方法の一例を示すフロー図である。図5は、図4と対応しているため、図5の各ステップに対応する符号は図4と合わせている。本例では、第1縮約処理として低ランク近似、第2縮約処理としてニューロン刈りがそれぞれ割り当てられている。
ここで、低ランク化行列の導出方法の例を説明する。重み算出処理部30は、次の式(1)を用いて、重み行列の特異値分解を行う。
以外の方法でもよく、主成分分析、固有値分解、QR分解を行う方法等が利用可能である。ユーザは、これらの手法を適宜選択することが可能である。
ここで、量子化プルーニングについて説明する。活性化されるニューロンが必ずしも大きい重みだけに反応しているわけではないことから、量子化プルーニングは、重みを離散的に残しながら行われる。なお、量子化プルーニングは、ニューロン刈りに限らず、シナプス刈りに対しても適用可能である。
次に、モデル縮約方法の別の具体例について説明する。図9は、モデル縮約方法の一例を示すフロー図である。図9は、図4と対応しているため、図9の各ステップに対応する符号は図4と合わせている。前述の例では、第1縮約処理として低ランク近似、第2縮約処理としてニューロン刈りがそれぞれ割り当てられていたが、本例では、第1縮約処理としてシナプス刈り、第2縮約処理として低ランク近似がそれぞれ割り当てられる。このように、本実施の形態では、縮約処理の内容を第1縮約処理と第2縮約処理との間で入れ換えても、縮約処理を実行することが可能である。
本実施の形態によれば、第1縮約処理により更新された重み行列に対し、第2縮約処理が行われ、サイズが縮小された重み行列が生成される。この構成によれば、第1縮約処理と第2縮約処理とが連続して行われるので、複数の縮約方法を組み合わせつつ、モデル縮約に係る設計期間の増大を抑えることが可能となる。
次に、実施の形態2について説明する。なお、以下では前述の実施の形態と重複する箇所については、原則として説明を省略する。以下で説明する実施の形態2、3では、重み行列の要素を変更する第1縮約処理が、第1縮約パラメータ及び第2縮約パラメータを用いて行われる。
次に、本実施の形態におけるモデル縮約方法の具体例について説明する。図12は、実施の形態2におけるモデル縮約方法の一例を示すフロー図である。図12は図11と対応しているステップもあるため、図11と対応するステップには同一の符号が付されている。本例では、第1縮約処理として低ランク近似、第2縮約処理としてニューロン刈りがそれぞれ割り当てられている。
次に、実施の形態3について説明する。図13は、本発明の実施の形態3に係るニューラルネットワークのモデル縮約装置の構成の一例を示すブロック図である。図13のモデル縮約装置301は、図10と類似しているが、学習・評価制御部310と、第1縮約パラメータ受付部20及び第2縮約パラメータ受付部40との間に縮約パラメータ算出処理部315が設けられている点が異なる。
Claims (1)
- ニューラルネットワークのモデル縮約装置であって、
前記ニューラルネットワークのモデルは、ネットワーク形状と前記ネットワーク形状に対応する重み行列とを含み、
第1縮約パラメータを用いて、前記重み行列の要素を変更する第1縮約処理を行い、前記重み行列を更新する第1縮約処理部と、
第2縮約パラメータを用いて、更新された前記重み行列のサイズを縮小する第2縮約処理を行い、縮小した前記重み行列に対応させて前記ネットワーク形状を変形する第2縮約処理部と、
直前に実行された前記第1縮約処理による縮約量と、前記第2縮約処理による縮約量との縮約比重を縮約パラメータとして算出する制御部と、
前記縮約比重を用いて前記第1縮約パラメータ及び前記第2縮約パラメータを算出する縮約パラメータ算出処理部と、
を備えている、
ニューラルネットワークのモデル縮約装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019055025A JP7150651B2 (ja) | 2019-03-22 | 2019-03-22 | ニューラルネットワークのモデル縮約装置 |
PCT/JP2020/011067 WO2020195940A1 (ja) | 2019-03-22 | 2020-03-13 | ニューラルネットワークのモデル縮約装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019055025A JP7150651B2 (ja) | 2019-03-22 | 2019-03-22 | ニューラルネットワークのモデル縮約装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020155010A JP2020155010A (ja) | 2020-09-24 |
JP7150651B2 true JP7150651B2 (ja) | 2022-10-11 |
Family
ID=72559403
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019055025A Active JP7150651B2 (ja) | 2019-03-22 | 2019-03-22 | ニューラルネットワークのモデル縮約装置 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP7150651B2 (ja) |
WO (1) | WO2020195940A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022136575A (ja) * | 2021-03-08 | 2022-09-21 | オムロン株式会社 | 推論装置、モデル生成装置、推論方法、及び推論プログラム |
JP2023083997A (ja) | 2021-12-06 | 2023-06-16 | 株式会社デンソー | モデル生成方法、モデル生成プログラム、モデル生成装置、データ処理装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180232640A1 (en) | 2017-02-10 | 2018-08-16 | Samsung Electronics Co., Ltd. | Automatic thresholds for neural network pruning and retraining |
JP2018129033A (ja) | 2016-12-21 | 2018-08-16 | アクシス アーベー | 人工ニューラルネットワークのクラスに基づく枝刈り |
-
2019
- 2019-03-22 JP JP2019055025A patent/JP7150651B2/ja active Active
-
2020
- 2020-03-13 WO PCT/JP2020/011067 patent/WO2020195940A1/ja active Application Filing
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018129033A (ja) | 2016-12-21 | 2018-08-16 | アクシス アーベー | 人工ニューラルネットワークのクラスに基づく枝刈り |
US20180232640A1 (en) | 2017-02-10 | 2018-08-16 | Samsung Electronics Co., Ltd. | Automatic thresholds for neural network pruning and retraining |
Also Published As
Publication number | Publication date |
---|---|
WO2020195940A1 (ja) | 2020-10-01 |
JP2020155010A (ja) | 2020-09-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11568258B2 (en) | Operation method | |
US11928600B2 (en) | Sequence-to-sequence prediction using a neural network model | |
JP6574503B2 (ja) | 機械学習方法および装置 | |
US20180260709A1 (en) | Calculating device and method for a sparsely connected artificial neural network | |
KR102410820B1 (ko) | 뉴럴 네트워크를 이용한 인식 방법 및 장치 및 상기 뉴럴 네트워크를 트레이닝하는 방법 및 장치 | |
US20190278600A1 (en) | Tiled compressed sparse matrix format | |
CN113168559A (zh) | 机器学习模型的自动化生成 | |
CN111105029B (zh) | 神经网络的生成方法、生成装置和电子设备 | |
WO2022105108A1 (zh) | 一种网络数据分类方法、装置、设备及可读存储介质 | |
US11775832B2 (en) | Device and method for artificial neural network operation | |
CN109447096B (zh) | 一种基于机器学习的扫视路径预测方法和装置 | |
US20190138929A1 (en) | System and method for automatic building of learning machines using learning machines | |
JP6521440B2 (ja) | ニューラルネットワーク及びそのためのコンピュータプログラム | |
US11657285B2 (en) | Methods, systems, and media for random semi-structured row-wise pruning in neural networks | |
JP7150651B2 (ja) | ニューラルネットワークのモデル縮約装置 | |
CN115860100A (zh) | 一种神经网络模型训练方法、装置及计算设备 | |
CN111325222A (zh) | 图像归一化处理方法及装置、存储介质 | |
CN116805157B (zh) | 无人集群自主动态评估方法及装置 | |
JP2023552048A (ja) | ハードウェアアクセラレータのためのニューラルアーキテクチャスケーリング | |
KR20220032861A (ko) | 하드웨어에서의 성능을 고려한 뉴럴 아키텍처 서치 방법 빛 장치 | |
CN117999560A (zh) | 机器学习模型的硬件感知渐进训练 | |
WO2021253440A1 (en) | Depth-wise over-parameterization | |
KR20210103912A (ko) | 뉴럴 네트워크를 학습시키는 학습 방법 및 장치, 뉴럴 네트워크를 이용한 데이터 처리 방법 및 장치 | |
WO2020054402A1 (ja) | ニューラルネットワーク処理装置、コンピュータプログラム、ニューラルネットワーク製造方法、ニューラルネットワークデータの製造方法、ニューラルネットワーク利用装置、及びニューラルネットワーク小規模化方法 | |
US20240142960A1 (en) | Automated simulation method based on database in semiconductor design process, automated simulation generation device and semiconductor design automation system performing the same, and manufacturing method of semiconductor device using the same |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210323 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220215 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220418 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220920 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220928 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7150651 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |