JP7419711B2 - 量子化パラメータ最適化方法、及び、量子化パラメータ最適化装置 - Google Patents
量子化パラメータ最適化方法、及び、量子化パラメータ最適化装置 Download PDFInfo
- Publication number
- JP7419711B2 JP7419711B2 JP2019163981A JP2019163981A JP7419711B2 JP 7419711 B2 JP7419711 B2 JP 7419711B2 JP 2019163981 A JP2019163981 A JP 2019163981A JP 2019163981 A JP2019163981 A JP 2019163981A JP 7419711 B2 JP7419711 B2 JP 7419711B2
- Authority
- JP
- Japan
- Prior art keywords
- quantization
- error
- quantization parameter
- function
- parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013139 quantization Methods 0.000 title claims description 233
- 238000005457 optimization Methods 0.000 title claims description 88
- 238000000034 method Methods 0.000 title claims description 58
- 230000006870 function Effects 0.000 claims description 165
- 238000013528 artificial neural network Methods 0.000 claims description 72
- 238000012706 support-vector machine Methods 0.000 claims description 58
- 238000000926 separation method Methods 0.000 claims description 41
- 238000004590 computer program Methods 0.000 claims description 14
- 239000013598 vector Substances 0.000 claims description 13
- 238000012360 testing method Methods 0.000 claims description 8
- 238000010586 diagram Methods 0.000 description 36
- 230000000875 corresponding effect Effects 0.000 description 15
- 238000012545 processing Methods 0.000 description 9
- 238000012549 training Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 6
- 238000009795 derivation Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 239000000470 constituent Substances 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000006866 deterioration Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- -1 standards Substances 0.000 description 1
- 238000002945 steepest descent method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2431—Multiple classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/245—Classification techniques relating to the decision surface
- G06F18/2451—Classification techniques relating to the decision surface linear, e.g. hyperplane
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/245—Classification techniques relating to the decision surface
- G06F18/2453—Classification techniques relating to the decision surface non-linear, e.g. polynomial classifier
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Medical Informatics (AREA)
- Neurology (AREA)
- Nonlinear Science (AREA)
- Feedback Control In General (AREA)
Description
まず、本実施の形態に係る量子化パラメータ最適化方法及び量子化パラメータ最適化装置について説明する。
以下、本実施の形態に係る量子化パラメータ最適化装置の構成等について説明する。図1は、本実施の形態に係る量子化パラメータ最適化装置10が行う最適化処理の概要を説明するための図である。
量子化パラメータ更新部102は、更新部の一例であり、コスト関数決定部101で決定されたコスト関数を用いて、量子化パラメータを更新する。ここで、量子化パラメータは、上述したように、ニューラルネットワークにおける重みパラメータが量子化されたパラメータである。量子化パラメータ更新部102は、量子化パラメータの更新を繰り返し実行する。
量子化パラメータ決定部103は、量子化パラメータ更新部102が量子化パラメータの更新を繰り返した結果、コスト関数により導出される関数値が、所定の条件を満たした場合の量子化パラメータを、量子化ニューラルネットワークの最適化された量子化パラメータとして決定する。
コスト関数決定部101は、取得した正則化項Ψを用いてコスト関数を決定する。より具体的には、ニューラルネットワークの出力値と期待される正解値との誤差を求める関数である誤差関数E(wq)に、重みパラメータ(w)と量子化パラメータ(wq)との誤差である量子化誤差(w-wq)の関数である正則化項Ψを加えたコスト関数L(wq)を決定する。
次に、本実施の形態に係る量子化パラメータ最適化装置10のハードウェア構成について、図6を用いて説明する。図6は、本実施の形態に係る量子化パラメータ最適化装置10の機能をソフトウェアにより実現するコンピュータ1000のハードウェア構成の一例を示す図である。
次に、本実施の形態に係る量子化パラメータ最適化方法について、図7を用いて説明する。図7は、本実施の形態に係る量子化パラメータ最適化方法を示すフローチャートである。
図8は、本実施の形態に係る正則化項決定部20が行う決定処理の概要を説明するための図である。
学習データ作成部201は、重みパラメータに複数の誤差を加えた重み誤差パラメータを与えた量子化ニューラルネットワークを用いて得た、テストデータに対する出力値それぞれの精度が所定の基準より高いまたは低いことを示すラベルを、当該出力値に対応する当該重み誤差パラメータに付与する。このようにして、学習データ作成部201は、重み誤差パラメータと精度とのデータセットからなる学習データを作成する。
学習実行部202は、学習データ作成部201が作成した学習データを用いて、SVMによる学習を行う。この結果、学習実行部202は、重み誤差パラメータを所定の基準より高い精度の出力値に対応する重み誤差パラメータと、所定の基準より低い精度の出力値に対応する重み誤差パラメータとに分離する面である分離境界面を得る。SVMによる学習としては、例えば線形2class SVMによる学習または非線形one class SVMによる学習がある。
正則化項導出部203は、学習実行部202により得た、g(x)=0で表される分離境界面から、関数であるg(x)を導出し、導出したg(x)に基づいて、正則化項Ψを決定する。
次に、本実施の形態に係る正則化項導出方法について図13を用いて説明する。図13は、本実施の形態に係る正則化項導出方法を示すフローチャートである。
以上のように、本実施の形態によれば、正則化項Ψの関数値と、量子化ニューラルネットワークが正解を推論する度合いを示す精度との間には負の相関があるような正則化項Ψを導出することができる。これにより、導出した正則化項Ψを誤差関数に加えたコスト関数を決定することができる。
以上、本開示に係る量子化パラメータ最適化方法などについて、各実施の形態に基づいて説明したが、本開示は、これらの実施の形態に限定されるものではない。本開示の主旨を逸脱しない限り、当業者が思いつく各種変形を各実施の形態に施したものや、各実施の形態における一部の構成要素を組み合わせて構築される別の形態も、本開示の範囲内に含まれる。
11、21 記憶部
20 正則化項決定部
50a 最適化前の量子化ニューラルネットワーク
50b 最適化後の量子化ニューラルネットワーク
60 テストデータ
101 コスト関数決定部
102 量子化パラメータ更新部
103 量子化パラメータ決定部
201 学習データ作成部
202 学習実行部
203 正則化項導出部
1000 コンピュータ
1001 入力装置
1002 出力装置
1003 CPU
1004 内蔵ストレージ
1005 RAM
1007 読取装置
1008 送受信装置
1009 バス
Claims (10)
- ニューラルネットワークにおける重みパラメータが量子化されたパラメータである量子化パラメータを最適化する、コンピュータプログラムにより実行される量子化パラメータ最適化方法であって、
前記ニューラルネットワークの出力値と期待される正解値との誤差を求める関数である誤差関数に、前記重みパラメータと前記量子化パラメータとの誤差である量子化誤差の関数である正則化項を加えたコスト関数を決定するコスト関数決定ステップと、
前記コスト関数を用いて、前記量子化パラメータを更新する更新ステップと、
前記更新ステップを繰り返した結果、前記コスト関数により導出される関数値が所定の条件を満たした場合の前記量子化パラメータを、前記ニューラルネットワークにおける重みパラメータが量子化された量子化ニューラルネットワークの最適化された量子化パラメータとして決定する量子化パラメータ決定ステップと、を含み、
前記正則化項の関数値と、前記量子化ニューラルネットワークが正解を推論する度合いを示す精度との間には負の相関がある、
量子化パラメータ最適化方法。 - 前記精度は、前記量子化ニューラルネットワークの出力値が、正解を推論したか否かを示す場合の適合率、再現率、前記適合率及び前記再現率の調和平均により算出されるF値、並びに、正解率のうちの少なくとも一の組み合わせである、
請求項1に記載の量子化パラメータ最適化方法。 - さらに、
前記重みパラメータに複数の誤差を加えた重み誤差パラメータを与えた前記量子化ニューラルネットワークを用いて得た、テストデータに対する出力値それぞれの前記精度が所定の基準より高いまたは低いことを示すラベルを、当該出力値に対応する前記重み誤差パラメータに付与することにより、前記重み誤差パラメータと精度とのデータセットからなる学習データを作成する学習データ作成ステップと、
作成した前記学習データを用いて、SVM(サポートベクターマシン)による学習を行い、前記重み誤差パラメータを前記所定の基準より高い前記精度の出力値に対応する重み誤差パラメータと前記所定の基準より低い前記精度の出力値に対応する重み誤差パラメータとに分離する面である分離境界面を得る学習ステップと、
前記学習ステップにおいて得た前記分離境界面に基づき、前記正則化項を決定する正則化項決定ステップと、を含む、
請求項1または2に記載の量子化パラメータ最適化方法。 - 前記正則化項決定ステップでは、
前記分離境界面から、g(x)を導出し、導出した前記g(x)に基づいて、前記正則化項を決定し、
前記SVMによる学習として、線形2 class SVMによる学習を行うことで、前記分離境界面を得た場合、前記g(x)は、下記の(式1)で表される、
ATx+b=g(x)・・・(式1)
ここで、xはn次元ベクトルの量子化誤差であり、Aはn次元ベクトルであり、bは定数である、
請求項3に記載の量子化パラメータ最適化方法。 - 前記カーネル関数は、ガウシアンカーネルである、
請求項5に記載の量子化パラメータ最適化方法。 - 前記カーネル関数は、シグモイドカーネルである、
請求項5に記載の量子化パラメータ最適化方法。 - 前記カーネル関数は、多項式カーネルである、
請求項5に記載の量子化パラメータ最適化方法。 - 前記正則化項決定ステップでは、
前記g(x)の関数であるtanh(-g(x))に基づいて,前記正則化項を決定する、
請求項4~8のいずれか1項に記載の量子化パラメータ最適化方法。 - ニューラルネットワークにおける重みパラメータが量子化されたパラメータである量子化パラメータを決定する量子化パラメータ最適化装置であって、
前記ニューラルネットワークの出力値と期待される正解値との誤差を求める関数である誤差関数に、前記重みパラメータと前記量子化パラメータとの誤差である量子化誤差の関数である正則化項を加えたコスト関数を決定するコスト関数決定部と、
前記コスト関数を用いて、前記量子化パラメータを更新する更新部と、
前記更新部が前記量子化パラメータの更新を繰り返した結果、前記コスト関数により導出される関数値が所定の条件を満たした場合の前記量子化パラメータを、前記ニューラルネットワークにおける重みパラメータが量子化された量子化ニューラルネットワークの最適化された量子化パラメータとして決定する量子化パラメータ決定部と、を備え、
前記正則化項の関数値と、前記量子化ニューラルネットワークが正解を推論する度合いを示す精度との間には負の相関がある、
量子化パラメータ最適化装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019163981A JP7419711B2 (ja) | 2019-09-09 | 2019-09-09 | 量子化パラメータ最適化方法、及び、量子化パラメータ最適化装置 |
US17/014,699 US11748600B2 (en) | 2019-09-09 | 2020-09-08 | Quantization parameter optimization method and quantization parameter optimization device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019163981A JP7419711B2 (ja) | 2019-09-09 | 2019-09-09 | 量子化パラメータ最適化方法、及び、量子化パラメータ最適化装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021043596A JP2021043596A (ja) | 2021-03-18 |
JP7419711B2 true JP7419711B2 (ja) | 2024-01-23 |
Family
ID=74851023
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019163981A Active JP7419711B2 (ja) | 2019-09-09 | 2019-09-09 | 量子化パラメータ最適化方法、及び、量子化パラメータ最適化装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US11748600B2 (ja) |
JP (1) | JP7419711B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7322622B2 (ja) * | 2019-09-17 | 2023-08-08 | 富士通株式会社 | 情報処理装置、情報処理方法及び情報処理プログラム |
US11861467B2 (en) * | 2020-03-05 | 2024-01-02 | Qualcomm Incorporated | Adaptive quantization for execution of machine learning models |
CN113238988B (zh) * | 2021-06-08 | 2023-05-30 | 中科寒武纪科技股份有限公司 | 优化深度神经网络的参数的处理系统、集成电路及板卡 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012159886A (ja) | 2011-01-28 | 2012-08-23 | Fujitsu Ltd | 情報照合装置、情報照合方法および情報照合プログラム |
JP2018010618A (ja) | 2016-05-03 | 2018-01-18 | イマジネイション テクノロジーズ リミテッド | 畳み込みニューラルネットワークハードウエア構成 |
JP2018045350A (ja) | 2016-09-13 | 2018-03-22 | Kddi株式会社 | 所定対象のうちの特定対象における状態を識別する装置、プログラム及び方法 |
JP6528884B1 (ja) | 2018-06-04 | 2019-06-12 | 富士通株式会社 | 学習プログラム、学習方法、及び情報処理装置 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0784975A (ja) * | 1993-09-10 | 1995-03-31 | Hitachi Ltd | 情報処理装置および学習演算処理方法 |
US11270187B2 (en) * | 2017-11-07 | 2022-03-08 | Samsung Electronics Co., Ltd | Method and apparatus for learning low-precision neural network that combines weight quantization and activation quantization |
US11948074B2 (en) * | 2018-05-14 | 2024-04-02 | Samsung Electronics Co., Ltd. | Method and apparatus with neural network parameter quantization |
US20210019630A1 (en) * | 2018-07-26 | 2021-01-21 | Anbang Yao | Loss-error-aware quantization of a low-bit neural network |
US11568222B2 (en) * | 2019-03-27 | 2023-01-31 | Integrated Silicon Solution, (Cayman) Inc. | System and method for classifying data using neural networks with errors |
-
2019
- 2019-09-09 JP JP2019163981A patent/JP7419711B2/ja active Active
-
2020
- 2020-09-08 US US17/014,699 patent/US11748600B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012159886A (ja) | 2011-01-28 | 2012-08-23 | Fujitsu Ltd | 情報照合装置、情報照合方法および情報照合プログラム |
JP2018010618A (ja) | 2016-05-03 | 2018-01-18 | イマジネイション テクノロジーズ リミテッド | 畳み込みニューラルネットワークハードウエア構成 |
JP2018045350A (ja) | 2016-09-13 | 2018-03-22 | Kddi株式会社 | 所定対象のうちの特定対象における状態を識別する装置、プログラム及び方法 |
JP6528884B1 (ja) | 2018-06-04 | 2019-06-12 | 富士通株式会社 | 学習プログラム、学習方法、及び情報処理装置 |
Also Published As
Publication number | Publication date |
---|---|
US20210073635A1 (en) | 2021-03-11 |
US11748600B2 (en) | 2023-09-05 |
JP2021043596A (ja) | 2021-03-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2017437537B2 (en) | Training tree-based machine-learning modeling algorithms for predicting outputs and generating explanatory data | |
JP7419711B2 (ja) | 量子化パラメータ最適化方法、及び、量子化パラメータ最適化装置 | |
JP6781415B2 (ja) | ニューラルネットワーク学習装置、方法、プログラム、およびパターン認識装置 | |
US11614978B2 (en) | Deep reinforcement learning for workflow optimization using provenance-based simulation | |
US20220067588A1 (en) | Transforming a trained artificial intelligence model into a trustworthy artificial intelligence model | |
US11886990B2 (en) | Classification device, classification method, and computer program product | |
US20210110215A1 (en) | Information processing device, information processing method, and computer-readable recording medium recording information processing program | |
JP2019197355A (ja) | クラスタリング装置、クラスタリング方法およびプログラム | |
CN112446888A (zh) | 图像分割模型的处理方法和处理装置 | |
JPWO2018116921A1 (ja) | 辞書学習装置、辞書学習方法、データ認識方法およびコンピュータプログラム | |
JP7298825B2 (ja) | 学習支援装置、学習装置、学習支援方法及び学習支援プログラム | |
JP6201556B2 (ja) | 予測モデル学習装置、予測モデル学習方法およびコンピュータプログラム | |
US20210397948A1 (en) | Learning method and information processing apparatus | |
CN112988275A (zh) | 一种基于任务感知的移动边缘计算多用户计算卸载方法 | |
WO2020059136A1 (ja) | 決定リスト学習装置、決定リスト学習方法および決定リスト学習プログラム | |
JP5486569B2 (ja) | パターン識別方法、パターン識別装置、およびプログラム | |
US20220300800A1 (en) | Techniques for adaptive generation and visualization of quantized neural networks | |
CN114819189A (zh) | 逻辑回归模型的数据处理方法、装置、处理器及电子设备 | |
JP7242590B2 (ja) | 機械学習モデル圧縮システム、プルーニング方法及びプログラム | |
JP7103987B2 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
JP7384322B2 (ja) | 予測モデル作成方法、予測方法、予測モデル作成装置、予測装置、予測モデル作成プログラム、予測プログラム | |
CN115362452A (zh) | 用于选择用于更新人工智能模块的数据集的方法 | |
JP5652250B2 (ja) | 画像処理プログラム及び画像処理装置 | |
JP2019095894A (ja) | 推定装置、学習装置、学習済みモデル、推定方法、学習方法、及びプログラム | |
JP6992864B1 (ja) | ニューラルネットワーク軽量化装置、ニューラルネットワーク軽量化方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220809 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230719 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230801 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230905 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231212 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231225 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7419711 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |