JP2022077466A - 情報処理装置およびニューラルネットワーク縮約方法 - Google Patents
情報処理装置およびニューラルネットワーク縮約方法 Download PDFInfo
- Publication number
- JP2022077466A JP2022077466A JP2020188356A JP2020188356A JP2022077466A JP 2022077466 A JP2022077466 A JP 2022077466A JP 2020188356 A JP2020188356 A JP 2020188356A JP 2020188356 A JP2020188356 A JP 2020188356A JP 2022077466 A JP2022077466 A JP 2022077466A
- Authority
- JP
- Japan
- Prior art keywords
- subgraph
- reduction
- neural network
- perturbation
- contraction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000008602 contraction Effects 0.000 title claims abstract description 73
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 36
- 230000010365 information processing Effects 0.000 title claims abstract description 17
- 238000005457 optimization Methods 0.000 claims abstract description 26
- 238000004364 calculation method Methods 0.000 claims description 35
- 238000013473 artificial intelligence Methods 0.000 description 22
- 238000010586 diagram Methods 0.000 description 21
- 238000001514 detection method Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 8
- 238000013527 convolutional neural network Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000007423 decrease Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000011946 reduction process Methods 0.000 description 2
- 102100025508 Cytoplasmic tRNA 2-thiolation protein 2 Human genes 0.000 description 1
- 101000856509 Homo sapiens Cytoplasmic tRNA 2-thiolation protein 2 Proteins 0.000 description 1
- 102100037812 Medium-wave-sensitive opsin 1 Human genes 0.000 description 1
- 101100376153 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) TY2A-F gene Proteins 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- JCCNYMKQOSZNPW-UHFFFAOYSA-N loratadine Chemical compound C1CN(C(=O)OCC)CCC1=C1C2=NC=CC=C2CCC2=CC(Cl)=CC=C21 JCCNYMKQOSZNPW-UHFFFAOYSA-N 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000013138 pruning Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/082—Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S17/00—Systems using the reflection or reradiation of electromagnetic waves other than radio waves, e.g. lidar systems
- G01S17/88—Lidar systems specially adapted for specific applications
- G01S17/93—Lidar systems specially adapted for specific applications for anti-collision purposes
- G01S17/931—Lidar systems specially adapted for specific applications for anti-collision purposes of land vehicles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S7/00—Details of systems according to groups G01S13/00, G01S15/00, G01S17/00
- G01S7/48—Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S17/00
- G01S7/4802—Details of systems according to groups G01S13/00, G01S15/00, G01S17/00 of systems according to group G01S17/00 using analysis of echo signal for target characterisation; Target signature; Target cross-section
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Computer Networks & Wireless Communication (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Neurology (AREA)
- Electromagnetism (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
S000:縮約前DNN,摂動計算部2(C006)から出力された部分グラフ摂動,部分グラフへの分割数上限である最大部分グラフ数,および最適化部(C007)から出力されたグラフ分割信号を部分グラフ分割部(C003)に入力し,縮約前DNNをn個の部分グラフに分割する。最大部分グラフ数は,予め設定するか,ユーザがその都度入力する。
図11Aに部分グラフ分割部の処理フローを示す。図9と合わせて説明する。
図11Bに分割される部分グラフの概念を示す。
・縮約コンフィグ・・・A002,B003,C002,E002,E011,F003,G003
・縮約DNN・・・A003,B005,E003,F005,G005
・部分グラフ分割部・・・A004,C003,E004
・縮約部・・・A005,B007,E005,F007,G007
・推論部・・・A006,B008,E006,F008,G008
・縮約テーブル・・・B002,C001,E013,F002,G002
・データセット・・・B004,E010,F004,G004
・縮約アルゴリズム最適化部・・・B006,E009,F006,G006
・仮縮約部・・・C004
・摂動計算部1・・・C005
・摂動計算部2・・・C006
・最適化部・・・C007
・ログファイル・・・C008,G010
・演算量削減部・・・D001
・部分グラフ結合部・・・D002
・再学習部・・・D003
・OTA受信器・・・E007,F009,G009
・OTA送信器・・・E008,G011
Claims (15)
- ニューラルネットワークを縮約するアルゴリズムを選定する情報処理装置であって,
ニューラルネットワークを部分グラフに分割する部分グラフ分割部と,
前記部分グラフのそれぞれに対して,複数の縮約手法から選択された一つを対応付けた縮約コンフィグを出力する最適化部と,
を備える情報処理装置。 - 前記部分グラフ分割部は,階層構造を有する前記ニューラルネットワークを,層単位で分割する,
請求項1記載の情報処理装置。 - さらに仮縮約部と第1の摂動計算部を備え,
前記仮縮約部は,前記部分グラフのそれぞれに対して,複数の縮約手法から選択された一つを対応付けて縮約して仮縮約部分グラフを出力し,
前記第1の摂動計算部は,前記ニューラルネットワークの順伝搬値および複数の前記仮縮約部分グラフを直列結合した順伝搬値の差に基づく,ニューラルネットワークの摂動を出力し,
前記最適化部は,前記ニューラルネットワークの摂動が,所定値を満たす縮約コンフィグを出力する,
請求項2記載の情報処理装置。 - 前記仮縮約部は,前記ニューラルネットワークが実装されるデバイスの種類と適用すべき縮約手法の優先度が対応付けられた縮約テーブルを参照して,複数の縮約手法から一つを選択する,
請求項3記載の情報処理装置。 - さらに第2の摂動計算部を備え,
前記第2の摂動計算部は,それぞれの前記部分グラフの順伝搬値および前記仮縮約部分グラフの順伝搬値の差に基づく,それぞれの部分グラフの摂動を出力し,
前記部分グラフ分割部は,前記部分グラフの摂動に基づいて,さらに分割する部分グラフを選定する,
請求項3記載の情報処理装置。 - 前記部分グラフ分割部は,現状において摂動が最大の部分グラフを,さらに分割する部分グラフとして選定する,
請求項5記載の情報処理装置。 - さらに縮約部を備え,
前記縮約部は,演算量削減部と部分グラフ結合部を備え,
前記演算量削減部は,前記部分グラフと前記縮約コンフィグを入力とし,前記部分グラフのそれぞれに対して,前記縮約コンフィグに記載された縮約手法を適用して縮約後部分グラフを出力し,
前記部分グラフ結合部は,前記演算量削減部の出力を入力とし,前記縮約後部分グラフを結合して,縮約後ニューラルネットワークを出力する,
請求項1記載の情報処理装置。 - さらに再学習部を備え、
前記再学習部は,前記縮約後ニューラルネットワークと学習用データセットを受付け,前記縮約後ニューラルネットワークを学習する,
請求項7記載の情報処理装置。 - 前記部分グラフの摂動を摂動ログとしてメモリに保持することを特徴とする、
請求項5記載の情報処理装置。 - 前記摂動ログを演算装置外に送信することを特徴とする、
請求項9記載の情報処理装置。 - ニューラルネットワークを部分グラフに分割する第1のステップ,
前記部分グラフのそれぞれに対して,複数の縮約手法から選択された一つを対応付けて仮縮約する第2のステップ,
を実行するニューラルネットワーク縮約方法。 - 仮縮約したニューラルネットワークの摂動を計算する第3のステップ,
前記ニューラルネットワークの摂動に基づいて,前記部分グラフに対する縮約手法の対応を変更する第4のステップ,
を実行する請求項11記載のニューラルネットワーク縮約方法。 - 前記部分グラフのそれぞれに対して,仮縮約した部分グラフ単位で部分グラフの摂動を計算する第5のステップ,
前記部分グラフの摂動に基づいて、さらに分割する部分グラフを選択する第6のステップ,
を実行する請求項11記載のニューラルネットワーク縮約方法。 - 前記第1のステップにおいて,前記部分グラフへの分割方法をm分木によって管理し,
前記ニューラルネットワークをm分木の根に保管し,前記m分木の根に保管された前記ニューラルネットワークをm分割し,前記根の子である深さ1のノードにm個の部分グラフを保管し,前記m分木の葉に保管された部分グラフを出力する,
請求項12記載のニューラルネットワーク縮約方法。 - 前記根の子である深さ1のノードに保管されたm個の部分グラフのうち,部分グラフの摂動が最大のノードに格納された部分グラフをm分割し,前記部分グラフの摂動が最大のノードの子に保管する,
請求項14記載のニューラルネットワーク縮約方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020188356A JP7538002B2 (ja) | 2020-11-11 | 2020-11-11 | 情報処理装置およびニューラルネットワーク縮約方法 |
PCT/JP2021/034898 WO2022102255A1 (ja) | 2020-11-11 | 2021-09-22 | 情報処理装置およびニューラルネットワーク縮約方法 |
US18/035,868 US20240070463A1 (en) | 2020-11-11 | 2021-09-22 | Information processing device and neural network compression method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020188356A JP7538002B2 (ja) | 2020-11-11 | 2020-11-11 | 情報処理装置およびニューラルネットワーク縮約方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022077466A true JP2022077466A (ja) | 2022-05-23 |
JP7538002B2 JP7538002B2 (ja) | 2024-08-21 |
Family
ID=81601815
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020188356A Active JP7538002B2 (ja) | 2020-11-11 | 2020-11-11 | 情報処理装置およびニューラルネットワーク縮約方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20240070463A1 (ja) |
JP (1) | JP7538002B2 (ja) |
WO (1) | WO2022102255A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118333101B (zh) * | 2024-06-12 | 2024-08-23 | 上海岩芯数智人工智能科技有限公司 | 一种参数量可变的神经网络模型构建方法及装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019050771A1 (en) | 2017-09-05 | 2019-03-14 | Panasonic Intellectual Property Corporation Of America | EXECUTION METHOD, EXECUTION DEVICE, LEARNING METHOD, LEARNING DEVICE, AND PROGRAM FOR DEEP NEURAL NETWORK |
JP6574004B2 (ja) | 2018-01-25 | 2019-09-11 | 株式会社モルフォ | 計算手法決定システム、計算手法決定装置、処理装置、計算手法決定方法、処理方法、計算手法決定プログラム、及び、処理プログラム |
JP7099968B2 (ja) | 2019-01-31 | 2022-07-12 | 日立Astemo株式会社 | 演算装置 |
-
2020
- 2020-11-11 JP JP2020188356A patent/JP7538002B2/ja active Active
-
2021
- 2021-09-22 US US18/035,868 patent/US20240070463A1/en active Pending
- 2021-09-22 WO PCT/JP2021/034898 patent/WO2022102255A1/ja active Application Filing
Also Published As
Publication number | Publication date |
---|---|
US20240070463A1 (en) | 2024-02-29 |
WO2022102255A1 (ja) | 2022-05-19 |
JP7538002B2 (ja) | 2024-08-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7462623B2 (ja) | 活性スパース化を用いたニューラルネットワーク加速・埋め込み圧縮システム及び方法 | |
JP6921079B2 (ja) | ニューラルネットワーク装置、車両制御システム、分解処理装置、及びプログラム | |
US10984308B2 (en) | Compression method for deep neural networks with load balance | |
US10832123B2 (en) | Compression of deep neural networks with proper use of mask | |
KR20200004700A (ko) | 뉴럴 네트워크에서 파라미터를 처리하는 방법 및 장치 | |
US12050976B2 (en) | Convolution operations utilizing nonzero padding data copied from input channel data | |
CN115437795B (zh) | 一种异构gpu集群负载感知的显存重计算优化方法及系统 | |
CN115017178A (zh) | 数据到文本生成模型的训练方法和装置 | |
WO2022102255A1 (ja) | 情報処理装置およびニューラルネットワーク縮約方法 | |
US20220171828A1 (en) | Selection of pauli strings for variational quantum eigensolver | |
US20170140072A1 (en) | Method and system for determining a configuration of a model having a collection of entities and satisfying a set of constraints | |
JP2023550921A (ja) | ニューラル・ネットワークにおける重みに基づく調節 | |
CN111931939A (zh) | 一种单振幅量子计算模拟方法 | |
CN116457794A (zh) | 用于神经网络模型的组平衡式稀疏激活特征图 | |
US20220121924A1 (en) | Configuring a neural network using smoothing splines | |
CN117910128A (zh) | 基于深度算子网络的翼型设计方法及装置 | |
US11574181B2 (en) | Fusion of neural networks | |
CN107038244A (zh) | 一种数据挖掘方法和装置、一种可读介质和存储控制器 | |
CN117035045A (zh) | 模型参数更新方法、装置、设备、存储介质和程序产品 | |
CN113341696A (zh) | 一种运载火箭姿态控制参数智能整定方法 | |
KR102574489B1 (ko) | 심층신경망의 선형변환 파라미터를 이용한 가지치기 방법 및 장치 | |
US20220138580A1 (en) | Data swapping for neural network memory conservation | |
US20220343162A1 (en) | Method for structure learning and model compression for deep neural network | |
CN117933104B (zh) | 固体姿轨控发动机燃气调节阀压强修正方法 | |
US11836613B2 (en) | Neural programmer interpreters with modeled primitives |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230704 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240521 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240712 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240723 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240808 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7538002 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |