JP7525126B2 - コンパイラで生成された量子化モデルを修正して正確度を修復する方法、コンピュータプログラム、およびコンピュータ装置 - Google Patents
コンパイラで生成された量子化モデルを修正して正確度を修復する方法、コンピュータプログラム、およびコンピュータ装置 Download PDFInfo
- Publication number
- JP7525126B2 JP7525126B2 JP2023530746A JP2023530746A JP7525126B2 JP 7525126 B2 JP7525126 B2 JP 7525126B2 JP 2023530746 A JP2023530746 A JP 2023530746A JP 2023530746 A JP2023530746 A JP 2023530746A JP 7525126 B2 JP7525126 B2 JP 7525126B2
- Authority
- JP
- Japan
- Prior art keywords
- quantization
- quantization parameter
- model
- modified
- processor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 120
- 238000004590 computer program Methods 0.000 title claims description 6
- 238000013139 quantization Methods 0.000 claims description 159
- 230000008569 process Effects 0.000 claims description 33
- 238000013135 deep learning Methods 0.000 claims description 27
- 230000004913 activation Effects 0.000 claims description 26
- 238000001994 activation Methods 0.000 claims description 26
- 238000012937 correction Methods 0.000 claims description 16
- 230000003247 decreasing effect Effects 0.000 claims description 8
- 230000004048 modification Effects 0.000 claims description 5
- 238000012986 modification Methods 0.000 claims description 5
- 238000012549 training Methods 0.000 claims description 5
- 230000015654 memory Effects 0.000 description 16
- 238000012545 processing Methods 0.000 description 12
- 238000004891 communication Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 230000007423 decrease Effects 0.000 description 5
- 239000013585 weight reducing agent Substances 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 230000002085 persistent effect Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000011946 reduction process Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000013138 pruning Methods 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0495—Quantised networks; Sparse networks; Compressed networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Devices For Executing Special Programs (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
Claims (11)
- 少なくとも1つのプロセッサを含むコンピュータ装置によって実行される、量子化されたモデルの正確度復元方法であって、
前記少なくとも1つのプロセッサにより、ディープラーニングコンパイラによって生成された前記量子化されたモデルのファイルの入力を受ける段階、
前記少なくとも1つのプロセッサにより、前記量子化されたモデルのファイルをパーシング(parsing)して、前記ファイルが含んでいる前記量子化されたモデルの加重値、および活性化のうちの少なくとも1つと前記加重値および活性化のうちの少なくとも1つと関連する量子化パラメータを抽出する段階、
前記少なくとも1つのプロセッサにより、前記加重値および前記活性化のうちの少なくとも1つを修正対象として選定する段階、
前記少なくとも1つのプロセッサにより、前記修正対象の量子化パラメータ再計算の過程において、学習データまたは有効データの使用の有無を考慮した上で、前記修正対象の量子化パラメータ再計算の過程を一度だけ実行する第1方式および前記修正対象の量子化パラメータ再計算の過程を複数回にわたり反復実行する第2方式のうちの1つの方式を選択し、選定された前記修正対象の量子化パラメータと関連するクリッピング範囲を調節して選択された前記方式によって選定された前記修正対象の量子化パラメータを再計算する段階、および
前記少なくとも1つのプロセッサにより、前記量子化されたモデルで選定された前記修正対象に対応する量子化パラメータを前記再計算された量子化パラメータに変更して最終量子化モデルを生成する段階
を含む、正確度復元方法。 - 前記第1方式は、学習データまたは有効データなく、前記量子化パラメータ再計算の過程を一度だけ実行する方式であることを特徴とする、請求項1に記載の正確度復元方法。
- 前記第1方式は、前記量子化パラメータと関連するクリッピング範囲の最大値および最小値に基づいて、前記量子化パラメータ再計算の過程を一度だけ実行する、請求項2に記載の正確度復元方法。
- 前記第2方式は、前記学習データまたは有効データの一部を使用して前記量子化パラメータ再計算の過程を複数回にわたり反復実行する方式であることを特徴とする、請求項1に記載の正確度復元方法。
- 前記第2方式は、複数回にわたり反復実行される前記量子化パラメータ再計算の過程において得られる複数の候補量子化パラメータのうちから前記再計算された量子化パラメータを決定する、請求項4に記載の正確度復元方法。
- 前記選定する段階は、
前記量子化されたモデルのチャネルまたはレイヤごとに、前記加重値および前記活性化のうちの少なくとも1つを前記修正対象として選定することを特徴とする、請求項1に記載の正確度復元方法。 - 選定された前記修正対象の量子化パラメータと関連するクリッピング範囲を調節する場合、
前記クリッピング範囲に対する最小値および最大値のうちの少なくとも1つを増加または減少させて前記クリッピング範囲を調節する、請求項1に記載の正確度復元方法。 - 選定された前記修正対象の量子化パラメータを再計算する前記段階は、
前記調節されたクリッピング範囲によって、前記修正対象の量子化パラメータとしてのスケールファクタとゼロポイントを再計算する段階を含むことを特徴とする、請求項1に記載の正確度復元方法。 - 前記第1方式が選択された場合、前記最終量子化モデルは、
前記最大値および最小値に基づいていくつかの前記第1方式を実行した結果モデルを含む、請求項3に記載の正確度復元方法。 - コンピュータ装置と結合して請求項1~9のうちのいずれか一項に記載の方法をコンピュータ装置に実行させるためにコンピュータ読み取り可能な記録媒体に記録される、コンピュータプログラム。
- コンピュータ装置で読み取り可能な命令を実行するように実現される少なくとも1つのプロセッサ
を含み、
前記少なくとも1つのプロセッサにより、
ディープラーニングコンパイラによって生成された量子化されたモデルのファイルの入力を受け、
前記量子化されたモデルのファイルをパーシング(parsing)して、前記ファイルが含んでいる前記量子化されたモデルの加重値および活性化のうちの少なくとも1つと前記加重値および活性化のうちの少なくとも1つと関連する量子化パラメータを抽出し、
前記加重値および前記活性化のうちの少なくとも1つを修正対象として選定し、
前記修正対象の量子化パラメータ再計算の過程において、学習データまたは有効データの使用の有無を考慮した上で、前記修正対象の量子化パラメータ再計算の過程を一度だけ実行する第1方式および前記修正対象の量子化パラメータ再計算の過程を複数回にわたり反復実行する第2方式のうちの1つの方式を選択し、選択された前記修正対象の量子化パラメータと関連するクリッピング範囲を調節して選択された前記方式によって選定された前記修正対象の量子化パラメータを再計算し、
前記量子化されたモデルで選定された前記修正対象に対応する量子化パラメータを前記再計算された量子化パラメータに変更して最終量子化モデルを生成すること
を特徴とする、コンピュータ装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2021-0171945 | 2021-12-03 | ||
KR1020210171945A KR20230083699A (ko) | 2021-12-03 | 2021-12-03 | 컴파일러에서 생성된 양자화 모델을 수정하여 정확도를 복원하는 방법 및 시스템 |
PCT/KR2021/018653 WO2023101079A1 (ko) | 2021-12-03 | 2021-12-09 | 컴파일러에서 생성된 양자화 모델을 수정하여 정확도를 복원하는 방법 및 시스템 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023553799A JP2023553799A (ja) | 2023-12-26 |
JP7525126B2 true JP7525126B2 (ja) | 2024-07-30 |
Family
ID=86612489
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023530746A Active JP7525126B2 (ja) | 2021-12-03 | 2021-12-09 | コンパイラで生成された量子化モデルを修正して正確度を修復する方法、コンピュータプログラム、およびコンピュータ装置 |
Country Status (3)
Country | Link |
---|---|
JP (1) | JP7525126B2 (ja) |
KR (2) | KR20230083699A (ja) |
WO (1) | WO2023101079A1 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020009048A (ja) | 2018-07-05 | 2020-01-16 | 株式会社日立製作所 | ニューラルネットワークの学習装置および学習方法 |
JP2020177535A (ja) | 2019-04-19 | 2020-10-29 | 富士通株式会社 | 情報処理装置、情報処理方法および情報処理プログラム |
JP2021043906A (ja) | 2019-09-13 | 2021-03-18 | 富士通株式会社 | 情報処理装置、情報処理方法および情報処理プログラム |
-
2021
- 2021-12-03 KR KR1020210171945A patent/KR20230083699A/ko active Application Filing
- 2021-12-09 WO PCT/KR2021/018653 patent/WO2023101079A1/ko active Application Filing
- 2021-12-09 JP JP2023530746A patent/JP7525126B2/ja active Active
-
2024
- 2024-01-23 KR KR1020240010023A patent/KR20240014564A/ko active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020009048A (ja) | 2018-07-05 | 2020-01-16 | 株式会社日立製作所 | ニューラルネットワークの学習装置および学習方法 |
JP2020177535A (ja) | 2019-04-19 | 2020-10-29 | 富士通株式会社 | 情報処理装置、情報処理方法および情報処理プログラム |
JP2021043906A (ja) | 2019-09-13 | 2021-03-18 | 富士通株式会社 | 情報処理装置、情報処理方法および情報処理プログラム |
Non-Patent Citations (1)
Title |
---|
Markus Nagel, Marios Fournarakis, Rana Ali Amjad, Yelysei Bondarenko, Mart van Baalen, Tijmen Blankevoort,A White Paper on Neural Network Quantization,arXiv[online],2021年06月15日,[検索日2023.12.27] Retrieved from the Internet: <URL: https://doi.org/10.48550/arXiv.2106.08295> |
Also Published As
Publication number | Publication date |
---|---|
WO2023101079A1 (ko) | 2023-06-08 |
KR20240014564A (ko) | 2024-02-01 |
KR20230083699A (ko) | 2023-06-12 |
JP2023553799A (ja) | 2023-12-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12050976B2 (en) | Convolution operations utilizing nonzero padding data copied from input channel data | |
EP3912076A1 (en) | Lookup table optimization for programming languages that target synchronous digital circuits | |
CA3155085C (en) | Hybrid quantum-classical computer system for parameter-efficient circuit training | |
US20220237513A1 (en) | Method and apparatus with optimization for deep learning model | |
US11636175B2 (en) | Selection of Pauli strings for Variational Quantum Eigensolver | |
US11983471B2 (en) | Providing reusable quantum circuit components as a curated service | |
US20210011757A1 (en) | System for operationalizing high-level machine learning training enhancements from low-level primitives | |
KR20210137767A (ko) | 파라미터 기반 양자 회로 구성 장치 및 방법 | |
KR20210149393A (ko) | 조합 최적화를 위한 강화학습 모델의 학습 장치 및 방법 | |
US20240231765A1 (en) | Machine-learned models for generating code snippets with predicted placeholders for optimizing software development | |
KR102552478B1 (ko) | 레이어 별 경량화를 통한 딥러닝 모델 최적화 방법 및 시스템 | |
US20230177314A1 (en) | Method and system for optimizing quantization model | |
JP7525126B2 (ja) | コンパイラで生成された量子化モデルを修正して正確度を修復する方法、コンピュータプログラム、およびコンピュータ装置 | |
US11710042B2 (en) | Shaping a neural network architecture utilizing learnable sampling layers | |
US20220405561A1 (en) | Electronic device and controlling method of electronic device | |
US20220092387A1 (en) | Systems and Methods for Producing an Architecture of a Pyramid Layer | |
KR102597182B1 (ko) | 입력 해상도 변경에 따른 특징맵 해상도 변경 방법 및 시스템 | |
KR100707781B1 (ko) | 컴퓨터 시스템에서 배열 연산을 효율적으로 처리하는 방법 | |
KR20200108789A (ko) | Dnn 프레임워크를 이용하는 단일 가속기용 프로그램을 복수의 가속기에서 처리하는 방법 및 컴퓨터 프로그램 | |
JP2020190901A (ja) | 演算処理装置、演算処理装置の制御プログラム及び演算処理装置の制御方法 | |
KR102574489B1 (ko) | 심층신경망의 선형변환 파라미터를 이용한 가지치기 방법 및 장치 | |
CN117454948B (zh) | 一种适用于国产硬件的fp32模型转换方法 | |
Dalvi et al. | One-Time Compilation of Device-Level Instructions for Quantum Subroutines | |
US20230177372A1 (en) | Optimized selection of data for quantum circuits | |
US20240160990A1 (en) | Circuit cutting taking into account transpilation error |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230518 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20230518 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240109 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240405 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240702 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240708 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7525126 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |