JP7298713B2 - パラメータ最適化装置、パラメータ最適化方法、およびパラメータ最適化プログラム - Google Patents
パラメータ最適化装置、パラメータ最適化方法、およびパラメータ最適化プログラム Download PDFInfo
- Publication number
- JP7298713B2 JP7298713B2 JP2021562433A JP2021562433A JP7298713B2 JP 7298713 B2 JP7298713 B2 JP 7298713B2 JP 2021562433 A JP2021562433 A JP 2021562433A JP 2021562433 A JP2021562433 A JP 2021562433A JP 7298713 B2 JP7298713 B2 JP 7298713B2
- Authority
- JP
- Japan
- Prior art keywords
- stride
- value
- layer
- dilation
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/082—Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/0985—Hyperparameter optimisation; Meta-learning; Learning-to-learn
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Description
以下、本発明の第1の実施形態を、図面を参照して説明する。図1は、第1の実施形態のパラメータ最適化装置200の一例を示すブロック図である。第1の実施形態に係るパラメータ最適化装置200は、図1に記載の2つの処理ブロックを含む。すなわち、パラメータ最適化装置200は、ストライドおよびディレーション使用層検出部211およびストライドおよびディレーション使用位置修正部212を含む。
g= gcd(Stride,Dilation)
S’(L)=S(L)/g
S’(L-1)=S(L-1)×g
D’(L)=D(L)/g ・・・(1)
実施形態2.
入力されたCNN構造情報を最適化して、出力するパラメータ最適化装置であって、
前記CNN構造情報のうち、各畳込み層のストライドおよびディレーションのパラメータ情報を抽出するストライドおよびディレーション使用層検出手段と、
畳込み層のストライドおよびディレーションのパラメータ情報を変更するストライドおよびディレーション使用位置修正手段と
を備えるパラメータ最適化装置。
ストライドおよびディレーション使用層検出手段およびストライドおよびディレーション使用位置修正手段は、
前記CNN構造における全ての畳込み層において変更可能なストライドおよびディレーションパラメータの組が存在しなくなるまで、繰り返し、パラメータ情報を抽出する処理、およびパラメータ情報を変更する処理を実行する
付記1記載のパラメータ最適化装置。
ストライドおよびディレーション使用層検出手段およびストライドおよびディレーション使用位置修正手段は、
前記CNN構造における畳込み層における各層を対象としてパラメータ情報を抽出する処理、およびパラメータ情報を変更する処理を実行し、当該対象を深い層から浅い層に順に変える
付記1記載のパラメータ最適化装置。
ストライドおよびディレーション使用位置修正手段は、ある畳込み層のストライドの値とディレーションの値との最大公約数が1より大である場合に、当該層のストライド、ディレーション双方の値を前記最大公約数により割った値に変更し、当該層の1層浅い畳込み層のストライドの値を、前記最大公約数を乗じた値に変更する
付記1から付記3のうちのいずれか1項に記載のパラメータ最適化装置。
ストライドおよびディレーション使用位置修正手段は、ある畳込み層のストライドの値とディレーションの値との双方の値が2の倍数である場合に、当該層のストライドの値と、ディレーションの値の双方を2で割った値に変更し、当該層の1層浅い畳込み層のストライドの値を、2倍した値に変更する
付記1から付記3のうちのいずれか1項に記載のパラメータ最適化装置。
ショートカット処理を含むCNN構造において、ストライドおよびディレーションの変更の結果に応じたショートカット処理の修正要否を判定するショートカット対応要否判定手段と、
前記ショートカット対応要否判定手段が修正要と判定した場合に、前記ショートカット処理を修正するショートカット対応処理導入手段と、
を備える付記1から付記5のうちのいずれか1項に記載のパラメータ最適化装置。
ショートカット対応要否判定手段は、
ストライドおよびディレーション使用位置修正手段によるストライドの変更がショートカット処理における加算処理をはさんだ2つの畳込み層において発生しているときにショートカット処理の修正要と判定する
付記6記載のパラメータ最適化装置。
ショートカット対応処理導入手段が、
修正前のショートカット処理が入力値を変換しない場合には、ストライドおよびディレーション使用位置修正手段による変更後のストライドの値と同値のストライドを持つ間引き処理、または、変更後ストライドの値と同値のストライドを持ち、重みが単位行列であるような1×1畳込み処理を導入し、
修正前のショートカット処理が1×1畳込み処理を含む場合には、当該1×1畳込み処理のストライドを、ストライドおよびディレーション使用位置修正手段による変更後のストライドの値を乗じた値に更新する
付記6または付記7記載のパラメータ最適化装置。
入力されたCNN構造情報を最適化して、出力するパラメータ最適化方法であって、
前記CNN構造情報のうち、各畳込み層のストライドおよびディレーションのパラメータ情報を抽出し、
畳込み層のストライドおよびディレーションのパラメータ情報を変更する
ことを特徴とするパラメータ最適化方法。
ショートカット処理を含むCNN構造において、ストライドおよびディレーションの変更の結果に応じたショートカット処理の修正要否を判定し、
修正要と判定した場合に、前記ショートカット処理を修正する
付記9記載のパラメータ最適化方法。
入力されたCNN構造情報を最適化して、出力するパラメータ最適化プログラムが格納されたコンピュータ読み取り可能な記録媒体であって、
前記パラメータ最適化プログラムは、
前記CNN構造情報のうち、各畳込み層のストライドおよびディレーションのパラメータ情報を抽出する処理と、
畳込み層のストライドおよびディレーションのパラメータ情報を変更する処理と
をプロセッサに実行させることを特徴とする。
前記パラメータ最適化プログラムは、
ショートカット処理を含むCNN構造において、ストライドおよびディレーションの変更の結果に応じたショートカット処理の修正要否を判定する処理と、
修正要と判定した場合に、前記ショートカット処理を修正する処理と
をプロセッサに実行させる付記11記載の記録媒体。
入力されたCNN構造情報を最適化して、出力するためのプログラムであって、
コンピュータに、
前記CNN構造情報のうち、各畳込み層のストライドおよびディレーションのパラメータ情報を抽出する処理と、
畳込み層のストライドおよびディレーションのパラメータ情報を変更する処理と
を実行させるためのパラメータ最適化プログラム。
コンピュータに、
ショートカット処理を含むCNN構造において、ストライドおよびディレーションの変更の結果に応じたショートカット処理の修正要否を判定する処理と、
修正要と判定した場合に、前記ショートカット処理を修正する処理と
を実行させる付記13のパラメータ最適化プログラム。
200 パラメータ最適化装置
211 ストライドおよびディレーション使用層検出部
212 ストライドおよびディレーション使用位置修正部
213 ショートカット対応要否判定部
214 ショートカット対応処理導入部
300 出力CNN構造
800 パラメータ最適化装置
811 ストライドおよびディレーション使用層検出手段
812 ストライドおよびディレーション使用位置修正手段
1000 CPU
1001 記憶装置
1002 メモリ
Claims (10)
- 入力されたCNN構造情報を最適化して、出力するパラメータ最適化装置であって、
前記CNN構造情報のうち、各畳込み層のストライドおよびディレーションのパラメータ情報を抽出するストライドおよびディレーション使用層検出手段と、
畳込み層のストライドおよびディレーションのパラメータ情報を変更するストライドおよびディレーション使用位置修正手段と
を備えるパラメータ最適化装置。 - ストライドおよびディレーション使用層検出手段およびストライドおよびディレーション使用位置修正手段は、
前記CNN構造における全ての畳込み層において変更可能なストライドおよびディレーションパラメータの組が存在しなくなるまで、繰り返し、パラメータ情報を抽出する処理、およびパラメータ情報を変更する処理を実行する
請求項1記載のパラメータ最適化装置。 - ストライドおよびディレーション使用層検出手段およびストライドおよびディレーション使用位置修正手段は、
前記CNN構造における畳込み層における各層を対象としてパラメータ情報を抽出する処理、およびパラメータ情報を変更する処理を実行し、当該対象を深い層から浅い層に順に変える
請求項1記載のパラメータ最適化装置。 - ストライドおよびディレーション使用位置修正手段は、ある畳込み層のストライドの値とディレーションの値との最大公約数が1より大である場合に、当該層のストライド、ディレーション双方の値を前記最大公約数により割った値に変更し、当該層の1層浅い畳込み層のストライドの値を、前記最大公約数を乗じた値に変更する
請求項1から請求項3のうちのいずれか1項に記載のパラメータ最適化装置。 - ストライドおよびディレーション使用位置修正手段は、ある畳込み層のストライドの値とディレーションの値との双方の値が2の倍数である場合に、当該層のストライドの値と、ディレーションの値の双方を2で割った値に変更し、当該層の1層浅い畳込み層のストライドの値を、2倍した値に変更する
請求項1から請求項3のうちのいずれか1項に記載のパラメータ最適化装置。 - ショートカット処理を含むCNN構造において、ストライドおよびディレーションの変更の結果に応じたショートカット処理の修正要否を判定するショートカット対応要否判定手段と、
前記ショートカット対応要否判定手段が修正要と判定した場合に、前記ショートカット処理を修正するショートカット対応処理導入手段と、
を備える請求項1から請求項5のうちのいずれか1項に記載のパラメータ最適化装置。 - ショートカット対応要否判定手段は、
ストライドおよびディレーション使用位置修正手段によるストライドの変更がショートカット処理における加算処理をはさんだ2つの畳込み層において発生しているときにショートカット処理の修正要と判定する
請求項6記載のパラメータ最適化装置。 - ショートカット対応処理導入手段が、
修正前のショートカット処理が入力値を変換しない場合には、ストライドおよびディレーション使用位置修正手段による変更後のストライドの値と同値のストライドを持つ間引き処理、または、変更後ストライドの値と同値のストライドを持ち、重みが単位行列であるような1×1畳込み処理を導入し、
修正前のショートカット処理が1×1畳込み処理を含む場合には、当該1×1畳込み処理のストライドを、ストライドおよびディレーション使用位置修正手段による変更後のストライドの値を乗じた値に更新する
請求項6または請求項7記載のパラメータ最適化装置。 - 入力されたCNN構造情報を最適化して、出力するパラメータ最適化方法であって、
前記CNN構造情報のうち、各畳込み層のストライドおよびディレーションのパラメータ情報を抽出し、
畳込み層のストライドおよびディレーションのパラメータ情報を変更する
ことを特徴とするパラメータ最適化方法。 - 入力されたCNN構造情報を最適化して、出力するパラメータ最適化プログラムであって、
コンピュータに、
前記CNN構造情報のうち、各畳込み層のストライドおよびディレーションのパラメータ情報を抽出する処理と、
畳込み層のストライドおよびディレーションのパラメータ情報を変更する処理と
を実行させるためのパラメータ最適化プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2019/047947 WO2021111633A1 (ja) | 2019-12-06 | 2019-12-06 | パラメータ最適化装置、パラメータ最適化方法、およびパラメータ最適化プログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JPWO2021111633A1 JPWO2021111633A1 (ja) | 2021-06-10 |
JPWO2021111633A5 JPWO2021111633A5 (ja) | 2022-07-27 |
JP7298713B2 true JP7298713B2 (ja) | 2023-06-27 |
Family
ID=76221185
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021562433A Active JP7298713B2 (ja) | 2019-12-06 | 2019-12-06 | パラメータ最適化装置、パラメータ最適化方法、およびパラメータ最適化プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20230004810A1 (ja) |
JP (1) | JP7298713B2 (ja) |
WO (1) | WO2021111633A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11983854B2 (en) * | 2020-11-10 | 2024-05-14 | Adobe Inc. | Denoising images rendered using Monte Carlo renderings |
EP4123526A1 (en) * | 2021-07-19 | 2023-01-25 | ALE International | Method and system for calculating and sharing a user occupancy status relative to use of multimedia applications |
CN113610223B (zh) * | 2021-08-03 | 2023-12-26 | 安谋科技(中国)有限公司 | 乘法电路、卷积运算方法、介质、片上系统和电子设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180225993A1 (en) | 2017-01-24 | 2018-08-09 | Tietronix Software, Inc. | System and method for three-dimensional augmented reality guidance for use of medical equipment |
JP2019175140A (ja) | 2018-03-28 | 2019-10-10 | 株式会社パスコ | 建築物抽出システム |
JP2019537139A (ja) | 2016-11-10 | 2019-12-19 | グーグル エルエルシー | ハードウェアにおけるカーネルストライドの実行 |
-
2019
- 2019-12-06 JP JP2021562433A patent/JP7298713B2/ja active Active
- 2019-12-06 WO PCT/JP2019/047947 patent/WO2021111633A1/ja active Application Filing
- 2019-12-06 US US17/781,539 patent/US20230004810A1/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019537139A (ja) | 2016-11-10 | 2019-12-19 | グーグル エルエルシー | ハードウェアにおけるカーネルストライドの実行 |
US20180225993A1 (en) | 2017-01-24 | 2018-08-09 | Tietronix Software, Inc. | System and method for three-dimensional augmented reality guidance for use of medical equipment |
JP2019175140A (ja) | 2018-03-28 | 2019-10-10 | 株式会社パスコ | 建築物抽出システム |
Non-Patent Citations (1)
Title |
---|
WANG, Tianyang ほか,Dilated Deep Residual Network for Image Denoising,[オンライン],arXiv,2017年09月27日,<URL: https://arxiv.org/pdf/1708.05473.pdf>,[検索日 2020.01.22] |
Also Published As
Publication number | Publication date |
---|---|
US20230004810A1 (en) | 2023-01-05 |
JPWO2021111633A1 (ja) | 2021-06-10 |
WO2021111633A1 (ja) | 2021-06-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7298713B2 (ja) | パラメータ最適化装置、パラメータ最適化方法、およびパラメータ最適化プログラム | |
US10394929B2 (en) | Adaptive execution engine for convolution computing systems | |
CN110119809B (zh) | 对神经网络中非对称量化数据执行mac运算的装置和方法 | |
US20180217962A1 (en) | Operation processing apparatus and operation processing method | |
JP7007488B2 (ja) | ハードウェアベースのプーリングのシステムおよび方法 | |
US20220383082A1 (en) | Neural network processing method and apparatus, computer device and storage medium | |
US10642622B2 (en) | Arithmetic processing device and control method of the arithmetic processing device | |
KR20180073118A (ko) | 컨볼루션 신경망 처리 방법 및 장치 | |
TW201942808A (zh) | 深度學習加速器及加快深度學習操作的方法 | |
JP6927320B2 (ja) | 推論装置、畳み込み演算実行方法及びプログラム | |
WO2020199476A1 (zh) | 基于脉动阵列的神经网络加速方法、装置、计算机设备及存储介质 | |
Nakandala et al. | Incremental and approximate inference for faster occlusion-based deep cnn explanations | |
US20220058450A1 (en) | Tabular convolution and acceleration | |
CN110633785B (zh) | 一种卷积神经网络的计算方法及系统 | |
WO2024027039A1 (zh) | 数据处理方法、装置、设备和可读存储介质 | |
KR102256289B1 (ko) | 인공 신경망에서 학습을 통한 로드 밸런싱 방법 및 시스템 | |
WO2021245942A1 (en) | Information processing apparatus, information processing method, and computer readable medium | |
CN114008632A (zh) | 可组合的神经网络内核 | |
CN117313809A (zh) | 用于在神经网络加速器上执行神经网络的方法和系统 | |
US20210303987A1 (en) | Power reduction for machine learning accelerator background | |
US20230196093A1 (en) | Neural network processing | |
CN114065119A (zh) | 数据处理方法及相关产品 | |
US20230040673A1 (en) | Optimised machine learning processing | |
JP7000586B2 (ja) | データ処理システムおよびデータ処理方法 | |
CN114662679B (zh) | 一种基于神经网络的数据处理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220530 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220530 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230516 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230529 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7298713 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |