JP2019079535A - パラメータ処理方法及び装置 - Google Patents
パラメータ処理方法及び装置 Download PDFInfo
- Publication number
- JP2019079535A JP2019079535A JP2018198683A JP2018198683A JP2019079535A JP 2019079535 A JP2019079535 A JP 2019079535A JP 2018198683 A JP2018198683 A JP 2018198683A JP 2018198683 A JP2018198683 A JP 2018198683A JP 2019079535 A JP2019079535 A JP 2019079535A
- Authority
- JP
- Japan
- Prior art keywords
- value
- update
- weight
- accumulated
- update value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/38—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
- G06F7/48—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
- G06F7/483—Computations with numbers represented by a non-linear combination of denominational numbers, e.g. rational numbers, logarithmic number system or floating-point numbers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Neurology (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Nonlinear Science (AREA)
- Image Analysis (AREA)
- Feedback Control In General (AREA)
Abstract
Description
桁数を示す場合、ウェートの最下位有効桁数は、2-4桁数でもあり、臨界値は、該最下位有効桁数2-4桁数に対応する値である2-4でもある。
30 浮動小数点値
310,315 符号ビット
320 指数部
330 仮数部
340 バイアス
35 固定小数点値8ビット固定小数点)
325 整数部
335 小数部
345 小数点
Claims (20)
- ロープレシジョン・ナンバーシステムを利用するニューラルネットワークにおいて、パラメータを処理する方法において、
前記ニューラルネットワークに含まれるノード間の連結関係に割り当てられるウェートのための個別アップデート値を計算する段階と、
前記個別アップデート値を累積バッファに累積する段階と、
前記累積バッファの累積アップデート値が臨界値以上である場合、前記累積アップデート値を利用し、前記ウェートをアップデートする段階と、を含む方法。 - 前記臨界値は、前記ウェートの最下位有効桁数に対応する値であり、
前記アップデートする段階は、
前記累積アップデート値のうち、前記ウェートの有効桁数に合算可能な部分を、有効アップデート値として決定する段階と、
前記ウェートに前記有効アップデート値を加算する段階と、
前記累積バッファの前記累積アップデート値から前記有効アップデート値を減算する段階と、を含むことを特徴とする請求項1に記載の方法。 - 前記方法は、
前記累積アップデート値が前記臨界値以上であるか否かを、既設定アップデート周期ごとに判断する段階をさらに含むことを特徴とする請求項1に記載の方法。 - 前記方法は、
前記累積アップデート値が前記臨界値より小さい場合、次のアップデート周期まで、前記計算された個別アップデート値を、前記累積バッファに累積し続ける段階をさらに含むことを特徴とする請求項3に記載の方法。 - 前記ウェートが、第1符号ビット、第1整数部及び第1小数部によって構成された固定小数点値であり、前記累積アップデート値が、第2符号ビット及び第2小数部によって構成された固定小数点値である場合、
前記アップデートする段階は、
前記累積アップデート値の前記第2小数部を示すビットのうち、前記ウェートの前記第1小数部とオーバーラップされる少なくとも1つのビットが示す値を、前記ウェートに加算する段階と、
前記オーバーラップされる少なくとも1つのビットの値を、前記第2符号ビットと同一値に初期化する段階と、を含むことを特徴とする請求項1ないし4のうち何れか一項に記載の方法。 - 前記方法は、
前記計算された個別アップデート値をモニタリングする段階と、
前記モニタリングの結果に基づいて、前記累積アップデート値の小数点の位置を調整する段階をさらに含むことを特徴とする請求項5に記載の方法。 - 前記モニタリングする段階は、
前記個別アップデート値の平均値をモニタリングする段階を含み、
前記調整する段階は、
前記個別アップデート値の平均値が前記臨界値の1/a倍(aは任意の自然数)より小さい場合、前記累積アップデート値の小数点の位置を、前記累積アップデート値の下位ビット方向に移動させる段階と、
前記個別アップデート値の平均値が前記臨界値の1/a倍より大きい場合、前記累積アップデート値の小数点の位置を、前記累積アップデート値の上位ビット方向に移動させる段階と、を含むことを特徴とする請求項6に記載の方法。 - 前記ウェートは、前記第1小数部のビット個数を調整することができる動的固定小数点値であることを特徴とする請求項5に記載の方法。
- 前記ウェートが、第1符号ビット、第1指数部、第1仮数部及び第1バイアスによって構成された浮動小数点値であり、前記累積アップデート値が、第2符号ビット、第2指数部、第2仮数部及び第2バイアスによって構成された浮動小数点値である場合、
前記アップデートする段階は、
前記ウェートの有効数字範囲に含まれる、前記累積アップデート値の実効値を、前記ウェートに加算する段階を含むことを特徴とする請求項1ないし8のうち何れか一項に記載の方法。 - 前記方法は、
前記累積アップデート値をモニタリングする段階と、
前記モニタリングの結果に基づいて、前記累積アップデート値の前記第2バイアスを調整する段階と、をさらに含むことを特徴とする請求項9に記載の方法。 - 前記調整する段階は、
前記累積アップデート値の前記第2指数部が前記臨界値を超える場合、前記第2バイアスを増大させる段階と、
前記累積アップデート値が前記臨界値の1/b倍(bは任意の自然数)より小さい場合、前記第2バイアスを低減させる段階と、を含むことを特徴とする請求項10に記載の方法。 - 請求項1ないし11のうちいずれか1項に記載の方法をコンピュータに実行させる命令語を含むコンピュータプログラム。
- ロープレシジョン・ナンバーシステムを利用するニューラルネットワークを実現する装置において、
少なくとも1つのプログラムが保存されたメモリと、
前記少なくとも1つのプログラムを実行することにより、前記ニューラルネットワークにおいて、パラメータを処理する少なくとも1つのプロセッサと、を含み、
前記少なくとも1つのプロセッサは、
前記ニューラルネットワークに含まれるノード間の連結関係に割り当てられるウェートのための個別アップデート値を計算し、前記個別アップデート値を累積バッファに累積し、前記累積バッファの累積アップデート値が臨界値以上である場合、前記累積アップデート値を利用し、前記ウェートをアップデートする装置。 - 前記臨界値は、前記ウェートの最下位有効桁数に対応する値であり、
前記少なくとも1つのプロセッサは、
前記累積アップデート値のうち、前記ウェートの有効桁数に合算可能な部分を有効アップデート値として決定し、前記ウェートに前記有効アップデート値を加算し、前記累積バッファの前記累積アップデート値を、前記有効アップデート値ほど減算することを特徴とする請求項13に記載の装置。 - 前記少なくとも1つのプロセッサは、
前記累積アップデート値が前記臨界値以上であるか否かを、既設定アップデート周期ごとに判断することを特徴とする請求項13に記載の装置。 - 前記少なくとも1つのプロセッサは、
前記累積アップデート値が前記臨界値より小さい場合、次のアップデート周期まで、前記計算された個別アップデート値を、前記累積バッファに累積し続けることを特徴とする請求項15に記載の装置。 - 前記ウェートが、第1符号ビット、第1整数部及び第1小数部によって構成された固定小数点値であり、前記累積アップデート値が、第2符号ビット及び第2小数部によって構成された固定小数点値である場合、
前記少なくとも1つのプロセッサは、
前記累積アップデート値の前記第2小数部を示すビットのうち、前記ウェートの前記第1小数部とオーバーラップされる少なくとも1つのビットが示す値を、前記ウェートに加算し、前記オーバーラップされる少なくとも1つのビットの値を、前記第2符号ビットと同一値に初期化することを特徴とする請求項13ないし16のうち何れか一項に記載の装置。 - 前記少なくとも1つのプロセッサは、
前記計算された個別アップデート値をモニタリングし、前記モニタリングの結果に基づいて、前記累積アップデート値の小数点の位置を調整することを特徴とする請求項17に記載の装置。 - 前記少なくとも1つのプロセッサは、
前記計算された個別アップデート値の平均値をモニタリングし、前記個別アップデート値の平均値が前記臨界値の1/a倍より小さい場合、前記累積アップデート値の小数点の位置を、前記累積アップデート値の下位ビット方向に移動させ、前記個別アップデート値の平均値が前記臨界値の1/a倍より大きい場合、前記累積アップデート値の小数点の位置を、前記累積アップデート値の上位ビット方向に移動させることを特徴とする請求項18に記載の装置。 - 前記ウェートが、第1符号ビット、第1指数部、第1仮数部及び第1バイアスによって構成された浮動小数点値であり、前記累積アップデート値が、第2符号ビット、第2指数部、第2仮数部及び第2バイアスによって構成された浮動小数点値である場合、
前記少なくとも1つのプロセッサは、
前記ウェートの有効数字範囲に含まれる前記累積アップデート値の実効値を、前記ウェートに加算することを特徴とする請求項13に記載の装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020170137374A KR20190044878A (ko) | 2017-10-23 | 2017-10-23 | 뉴럴 네트워크에서 파라미터를 처리하는 방법 및 장치 |
KR10-2017-0137374 | 2017-10-23 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019079535A true JP2019079535A (ja) | 2019-05-23 |
JP7072484B2 JP7072484B2 (ja) | 2022-05-20 |
Family
ID=63832196
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018198683A Active JP7072484B2 (ja) | 2017-10-23 | 2018-10-22 | パラメータ処理方法及び装置 |
Country Status (5)
Country | Link |
---|---|
US (2) | US11544549B2 (ja) |
EP (1) | EP3474195A1 (ja) |
JP (1) | JP7072484B2 (ja) |
KR (1) | KR20190044878A (ja) |
CN (1) | CN109697510B (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020213344A1 (ja) | 2019-04-18 | 2020-10-22 | 学校法人慶應義塾 | 大腸癌の発癌リスクを検出する方法及びキット |
JP2020201646A (ja) * | 2019-06-07 | 2020-12-17 | 富士通株式会社 | 演算処理装置、制御方法、及び制御プログラム |
EP3792837A1 (en) | 2019-09-09 | 2021-03-17 | Fujitsu Limited | Learning program and learning method |
EP3796233A1 (en) | 2019-09-13 | 2021-03-24 | Fujitsu Limited | Information processing device and method, and program |
JP2022502724A (ja) * | 2019-08-28 | 2022-01-11 | 上海寒武紀信息科技有限公司Shanghai Cambricon Information Technology Co., Ltd | データを処理するための方法、装置、および関連製品 |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6540725B2 (ja) * | 2017-01-30 | 2019-07-10 | 富士通株式会社 | 演算処理装置、方法、およびプログラム |
US11037330B2 (en) * | 2017-04-08 | 2021-06-15 | Intel Corporation | Low rank matrix compression |
CN108427671B (zh) * | 2018-01-25 | 2021-06-25 | 腾讯科技(深圳)有限公司 | 信息转换方法和装置、存储介质及电子装置 |
US10592208B2 (en) * | 2018-05-07 | 2020-03-17 | International Business Machines Corporation | Very low precision floating point representation for deep learning acceleration |
US11568207B2 (en) | 2018-09-27 | 2023-01-31 | Deepmind Technologies Limited | Learning observation representations by predicting the future in latent space |
JP6852141B2 (ja) * | 2018-11-29 | 2021-03-31 | キヤノン株式会社 | 情報処理装置、撮像装置、情報処理装置の制御方法、および、プログラム |
US11995854B2 (en) * | 2018-12-19 | 2024-05-28 | Nvidia Corporation | Mesh reconstruction using data-driven priors |
US11556615B2 (en) * | 2019-05-03 | 2023-01-17 | Tesla, Inc. | Data path for scalable matrix node engine with mixed data formats |
JP2021124849A (ja) * | 2020-02-04 | 2021-08-30 | 富士通株式会社 | 演算処理装置、演算処理装置の制御方法及び演算処理プログラム |
US10970619B1 (en) * | 2020-08-21 | 2021-04-06 | Moffett Technologies Co., Limited | Method and system for hierarchical weight-sparse convolution processing |
US20220199078A1 (en) * | 2020-12-22 | 2022-06-23 | Samsung Electronics Co., Ltd. | Electronic apparatus, system comprising electronic apparatus and server and controlling method thereof |
CN113984135A (zh) * | 2021-10-11 | 2022-01-28 | 青岛海尔空调电子有限公司 | 流量统计方法、装置、计算机可读存储介质及系统 |
CN113933652A (zh) * | 2021-10-15 | 2022-01-14 | 南方电网科学研究院有限责任公司 | 一种配电网高阻接地识别装置算法升级方法和系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0730373A (ja) * | 1993-07-07 | 1995-01-31 | Nippondenso Co Ltd | デジタルフィルタ |
JPH0784975A (ja) * | 1993-09-10 | 1995-03-31 | Hitachi Ltd | 情報処理装置および学習演算処理方法 |
US20170061279A1 (en) * | 2015-01-14 | 2017-03-02 | Intel Corporation | Updating an artificial neural network using flexible fixed point representation |
CN106650931A (zh) * | 2016-12-09 | 2017-05-10 | 曙光信息产业(北京)有限公司 | 混合精度深度学习算法 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4918618A (en) * | 1988-04-11 | 1990-04-17 | Analog Intelligence Corporation | Discrete weight neural network |
US7290024B2 (en) * | 2003-12-18 | 2007-10-30 | Intel Corporation | Methods and apparatus for performing mathematical operations using scaled integers |
DK3114540T3 (da) | 2014-03-06 | 2021-04-19 | Progress Inc | Neuralt netværk og fremgangsmåder til træning af neuralt netværk |
US20150324690A1 (en) * | 2014-05-08 | 2015-11-12 | Microsoft Corporation | Deep Learning Training System |
US10223635B2 (en) * | 2015-01-22 | 2019-03-05 | Qualcomm Incorporated | Model compression and fine-tuning |
CN106796668B (zh) * | 2016-03-16 | 2019-06-14 | 香港应用科技研究院有限公司 | 用于人工神经网络中比特深度减少的方法和系统 |
US10831444B2 (en) | 2016-04-04 | 2020-11-10 | Technion Research & Development Foundation Limited | Quantized neural network training and inference |
CN107239826A (zh) * | 2017-06-06 | 2017-10-10 | 上海兆芯集成电路有限公司 | 在卷积神经网络中的计算方法及装置 |
KR102601604B1 (ko) | 2017-08-04 | 2023-11-13 | 삼성전자주식회사 | 뉴럴 네트워크의 파라미터들을 양자화하는 방법 및 장치 |
-
2017
- 2017-10-23 KR KR1020170137374A patent/KR20190044878A/ko not_active Application Discontinuation
-
2018
- 2018-08-21 US US16/106,703 patent/US11544549B2/en active Active
- 2018-10-09 EP EP18199332.0A patent/EP3474195A1/en active Pending
- 2018-10-15 CN CN201811199602.9A patent/CN109697510B/zh active Active
- 2018-10-22 JP JP2018198683A patent/JP7072484B2/ja active Active
-
2022
- 2022-11-23 US US17/993,740 patent/US20230102087A1/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0730373A (ja) * | 1993-07-07 | 1995-01-31 | Nippondenso Co Ltd | デジタルフィルタ |
JPH0784975A (ja) * | 1993-09-10 | 1995-03-31 | Hitachi Ltd | 情報処理装置および学習演算処理方法 |
US20170061279A1 (en) * | 2015-01-14 | 2017-03-02 | Intel Corporation | Updating an artificial neural network using flexible fixed point representation |
CN106650931A (zh) * | 2016-12-09 | 2017-05-10 | 曙光信息产业(北京)有限公司 | 混合精度深度学习算法 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020213344A1 (ja) | 2019-04-18 | 2020-10-22 | 学校法人慶應義塾 | 大腸癌の発癌リスクを検出する方法及びキット |
JP2020201646A (ja) * | 2019-06-07 | 2020-12-17 | 富士通株式会社 | 演算処理装置、制御方法、及び制御プログラム |
JP7272121B2 (ja) | 2019-06-07 | 2023-05-12 | 富士通株式会社 | 演算処理装置、制御方法、及び制御プログラム |
JP2022502724A (ja) * | 2019-08-28 | 2022-01-11 | 上海寒武紀信息科技有限公司Shanghai Cambricon Information Technology Co., Ltd | データを処理するための方法、装置、および関連製品 |
EP3792837A1 (en) | 2019-09-09 | 2021-03-17 | Fujitsu Limited | Learning program and learning method |
US11676054B2 (en) | 2019-09-09 | 2023-06-13 | Fujitsu Limited | Computer-readable recording medium recording learning program and learning method |
EP3796233A1 (en) | 2019-09-13 | 2021-03-24 | Fujitsu Limited | Information processing device and method, and program |
Also Published As
Publication number | Publication date |
---|---|
US20190122106A1 (en) | 2019-04-25 |
US11544549B2 (en) | 2023-01-03 |
US20230102087A1 (en) | 2023-03-30 |
KR20190044878A (ko) | 2019-05-02 |
JP7072484B2 (ja) | 2022-05-20 |
CN109697510A (zh) | 2019-04-30 |
CN109697510B (zh) | 2024-03-08 |
EP3474195A1 (en) | 2019-04-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7072484B2 (ja) | パラメータ処理方法及び装置 | |
JP7349835B2 (ja) | ニューラルネットワークにおいてパラメータを処理する方法及び装置 | |
US11593625B2 (en) | Method and apparatus with neural network parameter quantization | |
US20190130273A1 (en) | Sequence-to-sequence prediction using a neural network model | |
US20180075342A1 (en) | Information processing apparatus, ising unit, and information processing apparatus control method | |
US20170061279A1 (en) | Updating an artificial neural network using flexible fixed point representation | |
JP7325158B2 (ja) | ニューラル・ネットワーク・コアにおける動的精度のためのデータ表現 | |
CN112074806A (zh) | 使用减小的位宽向量的块浮点计算 | |
US11093714B1 (en) | Dynamic transfer learning for neural network modeling | |
US11868874B2 (en) | Two-dimensional array-based neuromorphic processor and implementing method | |
US20190235834A1 (en) | Optimization apparatus and control method thereof | |
US20200257986A1 (en) | Artificial neural network implementation in field-programmable gate arrays | |
EP3893104A1 (en) | Methods and apparatus for low precision training of a machine learning model | |
KR20190089685A (ko) | 데이터를 처리하는 방법 및 장치 | |
KR20210103552A (ko) | 수들을 변환하기 위한 하드웨어 모듈 | |
US11995533B1 (en) | Executing replicated neural network layers on inference circuit | |
US20230068941A1 (en) | Quantized neural network training and inference | |
US11301209B2 (en) | Method and apparatus with data processing | |
CN116090511A (zh) | 卷积神经网络的预处理方法和加速方法、加速系统和介质 | |
US20240249124A1 (en) | System and method of neural network processing reducing instruction usage | |
Nikolić et al. | Schr\" odinger's FP: Dynamic Adaptation of Floating-Point Containers for Deep Learning Training | |
Zhang et al. | Adaptive-Precision Framework for SGD Using Deep Q-Learning | |
Tao et al. | An Approximate Parallel Annealing Ising Machine for Solving Traveling Salesman Problems | |
US20230185527A1 (en) | Method and apparatus with data compression | |
US20220092380A1 (en) | Optimization device, optimization method, and computer-readable recording medium storing optimization program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210415 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220331 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220412 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220510 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7072484 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |